API文档 - 概览
简介
💡
API v1版本共包括五大部分:
Speaker 语音
Avatar 数字人
Video 视频
Asset 资产
Upload 上传
使用流程
📌
音色模型
在API的 Voice 目录下,首先调用【Create Speaker】接口进行音色模型的创建,该接口会返回一个音色ID(speakerID),然后可通过【Query Status】或【List Speakers】接口查询训练结果与获取音色ID。
如果对音色克隆的结果不满意,可利用【Recreate Speaker】接口进行重新训练,可重新训练4次。
当拥有了训练成功的音色ID后,我们可以 调用【Text To Speech】接口使用语音合成的服务或用于训练数字人模型。
如果对音色克隆的结果不满意,可利用【Recreate Speaker】接口进行重新训练,可重新训练4次。
当拥有了训练成功的音色ID后,我们可以 调用【Text To Speech】接口使用语音合成的服务或用于训练数字人模型。
数字人模型
提供合适的视频素材后,我们可以进行数字人模型的训练,在API的 Avatar 目录下,调用【Train Avatar Model】接口创建训练任务,该接口会返回一个数字人ID(avatarID)。
可通过【Query Training Status】接口查询任务的实时训练状态。
后续可使用【List Avatars】接口来查询可用数字人模型列表。
可通过【Query Training Status】接口查询任务的实时训练状态。
后续可使用【List Avatars】接口来查询可用数字人模型列表。
视频合成
在API的 Video 目录下,选择【Create Video By Voice】、【Create Video By AudioFile】、【Create Video By Text】接口能够完成语音或文本驱动的数字人视频生成,最终的视频结果可通过【Query Status】查询,视频文件将以URL的形式返回,由于URL具有时效性,请尽快转存。
认证方式
💡

管理员企业微信
基础URL
📌
请求和响应格式
📌
{
"code": 0,
"data": any,
"msg": ""
}
如果接口失败或异常,code值为非零,data为空,msg的值为错误原因
修改于 2024-10-31 07:19:07