news 2026/6/9 23:36:04

123 口播数字人 API 接入实战:附完整前后端开源项目

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
123 口播数字人 API 接入实战:附完整前后端开源项目

在数字人相关应用中,口播视频是一类比较常见的使用场景。相比复杂的模型部署,通过 API 方式完成音视频合成,可以明显降低接入门槛。本文记录一次123 口播数字人 API的实际接入过程,包含接口参数说明、返回结构以及相关注意事项,并结合一个开源数字人项目,对整体接入方式进行说明,供学习与参考。

一、接口能力与使用场景说明

该接口主要用于音频驱动视频的口播合成场景,整体调用逻辑较为简单:

  • 提供视频地址

  • 提供音频地址

  • 提交合成任务

  • 通过回调或任务 ID 获取结果

适合用于学习数字人口播流程或进行功能验证。

二、接口基础信息

接口地址

POST https://api.yidevs.com/app/human/human/Musetalk/direct

调用方式

  • 请求方式:POST

  • 请求频率:不限

  • 按合成时长计费

三、请求 Header 参数说明

参数名必填类型说明
Authorizationstring控制台创建的 Token
Acceptstringapplication/json
Content-Typestringapplication/json

四、请求参数说明

参数名类型必填描述
callback_urlstring合成完成后的回调地址
video_urlstring视频文件的公网访问地址
audio_urlstring音频文件的公网访问地址

说明:

  • 视频与音频需为可直接访问的公网地址

  • 合成效果与素材质量有较大关系

五、接口返回示例与字段解析

{ "code": 200, "msg": "success", "data": { "video_task_id": 573, "bill_id": "1102", "tips": "合成后的视频地址有效期为24小时,请尽快保存!" } }

字段说明:

  • video_task_id:视频合成任务 ID

  • bill_id:计费记录标识

  • tips:系统提示信息

六、使用过程中的注意事项

在实际测试过程中,有以下几点需要注意:

  1. 生成后的视频链接有效期为 24 小时
    建议在回调后及时下载并保存

  2. 音频清晰度影响最终效果
    建议使用无背景音乐、无明显杂音的音频

  3. 视频素材尽量保持正脸和稳定画面
    频繁遮挡或大幅度转头会影响合成效果

七、开源数字人项目 GenHuman 简介(学习参考)

为了更直观地理解接口在实际项目中的使用方式,这里结合一个基于 API 的开源数字人项目GenHuman进行说明。

项目特点

  • 基于 API 接入数字人能力

  • 前后端结构完整,适合学习整体流程

  • 支持 Web、App、小程序等多端形式

技术栈说明

  • 后端:PHP(Webman 框架)

  • 前端:Uniapp

  • 数据库:MySQL

该项目不涉及模型部署,主要用于展示接口调用、任务管理及前端交互流程。

八、部署环境说明(简要)

项目运行环境要求如下:

  • PHP 8.1

  • MySQL 5.7

  • Nginx

  • Webman 官方依赖扩展

后台管理地址示例:

https://YourDomain/admin

九、总结

本文从接口调用角度,记录了 123 口播数字人 API 的基本使用方式,并结合一个开源项目,对数字人口播的整体接入流程进行了说明。对于希望了解音视频合成接口调用流程、或进行相关技术学习的开发者来说,希望该方案对你有一定的参考价值。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 21:28:39

为什么99%的人都不知道?普通手机竟可免费运行Open-AutoGLM(内附秘籍)

第一章:普通手机如何用Open-AutoGLMOpen-AutoGLM 是一个基于开源大语言模型的自动化推理框架,允许普通智能手机在本地运行轻量级 AI 任务,如文本生成、语音指令解析和智能问答。通过适配移动端的推理引擎,用户无需高性能设备即可体…

作者头像 李华
网站建设 2026/6/9 18:39:06

如何用Python轻松调用Open-AutoGLM?这4个避坑要点你必须知道

第一章:Python调用Open-AutoGLM接口的核心价值Python 作为人工智能和数据科学领域的主流编程语言,具备丰富的生态工具与简洁的语法结构,使其成为调用大模型接口的理想选择。通过 Python 调用 Open-AutoGLM 接口,开发者能够快速集成…

作者头像 李华
网站建设 2026/6/9 19:54:56

Python爬取科目一题库并生成Word文档

Python爬取科目一题库并生成Word文档 在准备驾照考试的过程中,很多人都会遇到同样的问题:理论题太多、太散,网上刷题不方便集中复习,更别提离线查阅了。虽然像“驾驶员考试网”这类平台提供了在线练习功能,但每道题都…

作者头像 李华
网站建设 2026/6/9 19:42:07

[AI] ai时代,传统程序员的角色心态改变

2025年末,AI编程正悄然重塑开发格局 只需两三句自然对话,AI Agent 即可自动生成可交付的程序文件,传统编码模式正面临颠覆。我最近试用了 Cursor 配合 Clash for Windows,体验了“所想即所得”的编程新范式——原本需一两天完成的…

作者头像 李华
网站建设 2026/6/9 13:47:16

解析 ‘PREEMPT_RT’ 补丁:如何将通用 Linux 改造为具备确定性响应的硬实时内核?

各位同仁,各位对系统编程与实时控制充满热情的工程师们:欢迎来到今天的讲座,我们将深入探讨一个在工业控制、航空航天、医疗设备以及高性能计算领域至关重要的技术——如何将我们熟悉的通用 Linux 操作系统改造为具备确定性响应的硬实时内核。…

作者头像 李华
网站建设 2026/6/9 13:48:33

Spark集群搭建与PySpark开发环境配置

Spark集群搭建与PySpark开发环境配置 在大数据处理日益成为企业核心能力的今天,构建一个稳定高效的分布式计算平台是开展数据分析、机器学习乃至大模型工程化的基础。Apache Spark 作为当前最主流的统一分析引擎,其快速、易用和通用的特点让它广泛应用于…

作者头像 李华