产品介绍
复制页面
闪剪 AI 开放平台
产品介绍
产品简介
产品定价
功能介绍
定制数字人/声音注意事项
常见问题
元数据-AI 显式标识和隐式标识说明
开发指南
快速接入
错误码
支持语种代码参照
模板编辑坐标计算说明
克隆
专业数字人克隆
POST
极速数字人克隆
POST
声音克隆
POST
图生数字人克隆
POST
数字人/声音删除
DELETE
音频合成
文本转语音
POST
视频合成
数字人口播视频(无包装)
POST
智能剪辑模板列表
GET
数字人口播混剪视频
POST
真人口播混剪视频
POST
素材混剪视频
POST
新闻体视频
POST
获取模板详情
GET
自定义数字人口播混剪视频
POST
自定义素材混剪视频
POST
自定义真人口播混剪视频
POST
音频转文字(ASR)
音频转文字(ASR)
图片生成
AI封面模板列表
AI封面图片生成
公共配音/公共数字人
公共配音列表
公共数字人列表
任务查询
查询任务详情
回调通知
制作类接口回调数据结构
相关协议
用户协议
隐私政策
付费协议
实名协议
数据模型
定制及制作类任务响应
制作任务结果回调数据
首帧封面(AI封面)
图层数据编辑
图层数据详情
产品介绍
复制页面
定制数字人/声音注意事项
1. 数字人克隆时长
#
** 专业版**
数字人训练视频时长 30~120秒,对应训练时间1~6小时;
数字人训练视频时间越长、文件越大,对应训练时间越长
** 极速版**
数字人训练视频时长 5~60秒,没有训练时间;
极速数字人首次制作视频时间比第二次制作视频时间长3-5分钟;
训练视频参考:
2. 授权视频
#
授权视频的内容整体含义是明确授权品牌
如下方视频中,授权对象是“闪剪”,品牌名则传“闪剪”
案例:我是xxx(真实姓名),我授权【闪剪】使用视频中的肖像、声音,为我生成定制数字人及声音,并 在本人【闪剪】账号中创作使用。
3. 数字人审核相关
#
数字人定制为何需要授权视频?
因合规部门要求,使用用户形象训练数字人需要明确得到用户的授权;
4. 数字人克隆视频要求/数字人训练失败原因
#
为了获得更理想的效果,请在光线充足、安静的环境下录制。拍摄视频时,请注意不要遮挡面部。
口播话术没有要求
第一秒闭嘴
不能挡住嘴巴
不能拍侧脸,侧脸幅度不大于45度
不能多人脸出现在画面
保持人物一直在画面中
5. 声音克隆要求
#
录制过程,请保持环境安静,没有杂音、噪音、回声和混响
录制一段单人说话的音频,建议录制时麦克风离嘴巴大约10厘米的距离
录音时,要保持情绪稳定,语速均匀,就像平时聊天一样自然
录音建议用普通话,尽量不要有方言、英文或字母
录制的语气也会被克隆,请按照期望的语气进行朗读
录音建议
#
环境选择:
录音环境的选择主要考虑降低噪音和混响,建议使用 10 平方米以内的小型房间进行录音,特别是配置吸音装置的房间,录音效果更佳。
如条件允许,可以使用价格较低的吸音棉对房间进行改造,改变声波的平面反射为漫反射,从而降低混响,提高录音质量。
噪音控制
室外噪音:关闭门窗缓解噪音。
室内噪音:室内噪音主要来自空调、风扇(含电脑风扇)、日光灯镇流器、人声等。
可以利用手机录制环境声音,放大音量倾听录音,识别并关闭噪音源。
混响控制
混响是指声音在空间中反射、折射、扩散并逐渐衰减的过程所产生的听觉效果。声波在 墙壁、玻璃上等光滑平面上反射时,会导致声音浑浊。
录制声音时,建议不要选择空旷的房间,尽量选用配有吸音设施的场所,或摆放不规则的环境,降低混响影响。日常办公区域和会议室通常存在较高混响,不建议使用其作为录音环境。
操作说明
普通的卧室是相对常见的理想录音环境,录音时需注意:
与手机保持约 10 厘米距离,避免太近/太远造成喷麦和电流问题。
关闭门窗,降低室外噪音。
关闭空调/电扇,减少内部噪音干扰。
拉上窗帘,降低玻璃的声音反射。
打开柜门、使用衣物、床单等覆盖柜面/桌面,降低光滑平面的声音反射,提高录音质量。
录音文案
在录音前熟悉文案,确定好人设及演绎风格,避免“读稿”,以免复刻的效果与您的心理预期不符。
录音
参考文案内容,自然表达。
发音清晰,吐字清楚,句与句之间断句清晰,每句之间停顿。
录音过程中不要有喘息声或其他声响。
通过多次录制找到最佳状态,不断提升录音质量。
修改于
2026-04-09 07:12:58
上一页
功能介绍
下一页
常见问题