产品介绍
复制页面
闪剪 AI 开放平台
产品介绍
产品简介
产品定价
功能介绍
常见问题
元数据-AI 显式标识和隐式标识说明
开发指南
快速接入
错误码
支持语种代码参照
模板编辑坐标计算说明
克隆
专业数字人克隆
POST
极速数字人克隆
POST
声音克隆
POST
图生数字人克隆
POST
数字人/声音删除
DELETE
音频合成
文本转语音
POST
视频合成
数字人口播视频(无包装)
POST
智能剪辑模板列表
GET
数字人口播混剪视频
POST
真人口播混剪视频
POST
素材混剪视频
POST
新闻体视频
POST
获取模板详情
GET
自定义数字人口播混剪视频
POST
自定义素材混剪视频
POST
自定义真人口播混剪视频
POST
音频转文字(ASR)
音频转文字(ASR)
图片生成
AI封面模板列表
AI封面图片生成
公共配音/公共数字人
公共配音列表
公共数字人列表
任务查询
查询任务详情
回调通知
制作类接口回调数据结构
相关协议
用户协议
隐私政策
付费协议
实名协议
数据模型
定制及制作类任务响应
制作任务结果回调数据
首帧封面(AI封面)
图层数据编辑
图层数据详情
产品介绍
复制页面
常见问题
1. 资源包相关
#
购买了低权益资源包后,又购买了高权益资源包,权益如何生效?
高权益资源包优先生效,叠加购买高权益资源包时,已购低权益资源包有效期会冻结,待高权益资源包消耗完毕后,会继续消耗低权益资源包;
公共并发数具体指什么?
指单模块(极速数字人、专业数字人、声音克隆、视频合成)同时间段内最多可同时提交处理的任务数;
超过并发的任务如何处理?
超并发任务会失败返回,建议自行做排队机制
2. 结果保存
#
视频/音频结果和素材不存储,只单次临时使用,视频合成的结果文件24小时有效;需客户自有服务器自行转存
视频结果
保存多久?
生成的视频结果仅保留
24小时
,生成视频后需要尽快保存;
音频结果
保存多久?
生成的视频结果仅保留
24小时
,生成视频后需要尽快保存;
素材
保存多久?
素材不存储,只单次临时使用
3. 算力扣除相关
#
生成的结果视频扣除算力小于1算力时,按照1算力计算,保留两位小数;
4. 数字人审核相关
#
数字人定制为何需要授权视频?
因合规部门要求,使用用户形象训练数字人需要明确得到用户的授权;
5. 数字人克隆时长
#
** 专业版**
数字人训练视频时长 30~120秒,对应训练时间1~6小时;
数字人训练视频时间越长、文件越大,对应训练时间越长
** 极速版**
数字人训练视频时长 5~60秒,没有训练时间;
极速数字人首次制作视频时间比第二次制作视频时间长3-5分钟;
训练视频参考:
6. 授权视频
#
授权视频的内容整体含义是明确授权品牌
如下方视频中,授权对象是“闪剪”,品牌名则传“闪剪”
案例:我是xxx(真实姓名),我授权【闪剪】使用视频中的肖像 、声音,为我生成定制数字人及声音,并在本人【闪剪】账号中创作使用。
7. 数字人克隆视频要求/数字人训练失败原因
#
为了获得更理想的效果,请在光线充足、安静的环境下录制。拍摄视频时,请注意不要遮挡面部。
口播话术没有要求
第一秒闭嘴
不能挡住嘴巴
不能拍侧脸,侧脸幅度不大于45度
不能多人脸出现在画面
保持人物一直在画面中
8. 声音克隆要求
#
录制过程,请保持环境安静,没有杂音、噪音、回声和混响
录制一段单人说话的音频,建议录制时麦克风离嘴巴大约10厘米的距离
录音时,要保持情绪稳定,语速均匀,就像平时聊天一样自然
录音建议用普通话,尽量不要有方言、英文或字母
录制的语气也会被克隆,请按照期望的语气进行朗读
录音建议
#
环境选择:
录音环境的选择主要考虑降低噪音和混响,建议使用 10 平方米以内的小型房间进行录音,特别是配置吸音装置的房间,录音效果更佳。
如条件允许,可以使用价格较低的吸音棉对房间进行改造,改变声波的平面反射为漫反射,从而降低混响,提高录音质量。
噪音控制
室外噪音:关闭门窗缓解噪音。
室内噪音:室内噪音主要来自空调、风扇(含电脑风扇)、日光灯镇流器、人声等。
可以利用手机录制环境声音,放大音量倾听录音,识别并关闭噪音源。
混响控制
混响是指声音在空间中反射、折射、扩散并逐渐衰减的过程所产生的听觉效果。声波在墙壁、玻璃上等光滑平面上反射时,会导致声音浑浊。
录制声音时,建议不要选择空旷的房间,尽量选用配有吸音设施的场所,或摆放不规则的环境,降低混响影响。日常办公区域和会议室通常存在较高混响,不建议使用其作为录音环境。
操作说明
普通的卧室是相对常见的理想录音环境,录音时需注意:
与手机保持约 10 厘米距离,避免太近/太远造成喷麦和电流问题。
关闭门窗,降低室外噪音。
关闭空调/电扇,减少内部噪音干扰。
拉上窗帘,降低玻璃的声音反射。
打开柜门、使用衣物、床单等覆盖柜面/桌面,降低光滑平面的声音反射,提高录音质量。
录音文案
在录音前熟悉文案,确定好人设及演绎风格,避免“读稿”,以免复刻的效果与您的心理预期不符。
录音
参考文案内容,自然表达。
发音清晰,吐字清楚,句与句之间断句清晰,每句之间停顿。
录音过程中不要有喘息声或其他声响。
通过多次录制找到最佳状态,不断提升录音质量。
9. 何为身份栏
#
“身份栏”是视频画面上用来介绍“这个人是谁”的标签或字幕。它是一个非常重要的制作元素,用于提升视频的信息量和观看体验,如图所示
10. 制作视频失败常见原因:
#
1.
数字人不按要求拍摄
2.
文案内容审核不通过,审核类目:黄、赌、毒、涉政
3.
素材内容审核不通过,审核类目:黄、赌、毒、涉政
4.
素材资源不可访问,素材包含:真人口播的视频、插入的素材、音频地址、背景音乐地址等
5.
素材不符合格式要求,要求详见具体接口返回内容
11. 相关资源审核不通过,文案、素材则涉及政治、色情、暴力等归为行为