news 2026/6/8 23:48:19

[技术讨论] 基于VC02-Kit的具彩灯效果的语音式歌曲点播台

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[技术讨论] 基于VC02-Kit的具彩灯效果的语音式歌曲点播台

除天猫精灵之类的在线智能语音点播装置,其他的歌曲点播装置多是通过操作界面来控制。
这里就向大家介绍一种在离线方式下能够以语音式歌曲点播台,此外它还能够产生色彩及亮度上的变化。
该设计是采用VC02-Kit与MP3播放模块所构成,其中VC02-Kit负责语音指令的识别处理,而MP3播放模块则负责歌曲的存储及播放处理,两者间的联系是通过串口通讯来完成。
1. VC02-Kit
VC02-Kit是安信可出品的一款离线式语音开发板,相较于在线语音识别,它具有不受在线通讯制约的特点,并可以语音的方式来控制相应的外设。
VC02-Kit是一组套件,它由开发板、咪头及正方形扬声器组成,见图1所示。


图1 套件构成

该模组使用采用的是云知声所推出的语音芯片 US516P6,它在离线识别算法与芯片架构方面有深度的融合,为客户提供了超低成本的离线语音识别方案。
US516P6 芯片采用 32bit RISC 架构内核,并加入了专门针对信号处理和语音识别所需要的 DSP 指令集,它支持浮点运算的 FPU 运算单元,以及 FFT 加速器。
VC-02 可支持 150 条本地指令离线识别,并具有一定的外围接口供用户进行客制化设计。
该模组支持单通道麦克风输入 和 双声道DAC 输出,它内置 了2MB Flash 和 242KB SRAM,并集成多种语音降噪技术,可实现高识别率与低延迟性响应,并支持 中英文双语控制。
该模组提供的外围接口如图2所示,可提供GPIO输出、I2C、PWM、DAC及UART输出。


图2 引脚资源

2. MP3播放模块
MP3播放模块是一种支持MP3格式语音文件播放的功能模块,其外观如图3所示。选取该模块的原因在于它是以TF卡的方式来存储MP3文件,这样有利于文件内容的快速更换且存储量很大。


图3 MP3播放模块

该模块支持2种工作模式,即手工操作模式和串口控制模式。在与VC02-Kit配合的情况下,是以串口模式来实现两者的数据交流。
在串口模式下,可执行的串口指令有:播放、下一首、上一首、暂停、停止、音量设置及播放指定乐曲等。
在所用MP3播放模块播放时,需外接一个扬声器来配合。

3. 开发工具及设计
有别于常规的开发,VC02-Kit采用的是一种线上的开发平台,在提交相关的设置后,它可自动生成目标文件。
在生成目标文件后,通过板载的串口资源在相关下载软件的配合下,可快速完成目标文件的下载处理。
安信可创建产品设计的官网为: HYPERLINK "http://voice.ai-thinker.com/" \t "https://bbs.eeworld.com.cn/_blank" /,其界面如图4所示。当然在创建产品前,是必须进行注册的。


图4 开发平台界面

在进入平台后,点击“创建产品”功能,即开始了创建过程,其填写产品名称及模组选取的形式如图5所示。


图5 产品名称及模组选取

鉴于设计的需要,其引脚配置如图6所示。其中UART1_TX用于发送控制指令,GPIO_A27用于控制蓝色LED,而PWM3和PWM4用于控制红色和绿色LED,并可对其进行亮度调节。


图6 引脚配置

将唤醒词设为“百灵鸟”,见图7所示。


图7 设置唤醒词

为实现语音控制,其设置的基础信息如图8所示,通过这些语音指令可实现MP3模块的相应处理功能。在这些信息中,"行为"采用英文来命名,它相当于是定义了一个处理函数名;"命令词"采用中文来命名,它是用户发出的语音指令;"回复语"采用中文方式,它是系统在识别了语音指令后,所发出的语音恢复内容。


图8 基础信息

为了执行语音指令的功能,需为串口指定相应的发送内容,其添加控制的对话框如图9所示,其中的参数即为发送的内容。


图9 添加控制

在完成添加后,其控制详情如图10所示。

在设置的信息中,“控制类型”是指所使用的引脚名称及功能;“动作”是指引脚所要执行的操作,“参数”是指操作所需的数据支持。

以语音指令“播放”为例,它的动作行为就是通过串口1的发送引脚向MP3模块发送出播放的指令,其内容为“7E FF 06 0D 00 00 00 FE EE EF”,其他类此。


图10 控制详情

除了控制MP3模块,还可按图11所示来添加相应的彩灯控制内容,它是通过通过GPIO和PWM来点亮相应的LED灯并通过占空比的不同来添加LED灯的亮度。

以语音指令“播放”为例,它在实现向MP3模块发送出播放的指令外,还添加了3个控制行为,以控制3个连接到RGB_LED模块的引脚,从而产生色彩的变化。

在这3个引脚中,PWM3被连到R引脚,PWM4被连接到G引脚,GPIO1_27被连接到B引脚。

PWM3因输出占空比为100%的脉冲,而点亮红色LED;PWM4因输出占空比为0%的脉冲,而无法点亮绿色的LED;GPIO1_27因输出低电平也无法被点亮,故只能呈现出红色。

同理,语音指令“下一首”则因相应的设置而呈现出绿色。

用于不同的语音指令被赋予了不同的显示色彩,故在语音指令操作时,便呈现出了多彩的色彩变化效果,从而达到活跃氛围的效果。


图11 彩灯控制

在完成上述的配置外,还可选取不同的发言人以不同的音色来发出提示信息,其选取环节见图12所示。


图12 选取发言人

在完成了全部语音SDK设置后,即可进入目标程序的生成阶段,见图13所示。在点击“生成SDK”后,回给出大致的生成时间,见图14所示。


图13 完成语音SDK设置


图14 生成处理中

在目标程序生成后,会生成一个名为output的压缩包,经下载和解压其内容如图15所示。在4个文件中,使用文件uni_app_release_update.bin即可。


图15 解压内容

为了将目标程序下载到VC02-Kit,需使用工具软件UniOneUpdateTool.exe。该软件的使用十分简单,其界面如图16所示,在正确选取串口和目标文件的情况下完成下载。


图16 软件界面


图17 完成下载

至此,就完成了整体的设计工作,在连接好MP3语音模块的情况下,其测试视频如下。


图18 连接及播放状态

演示视频:

播放控制中的彩灯切换效果:


对于感兴趣者,在具备硬件的条件下,还可使用下面的目标文件自行来验证设计效果。

目标文件:

uni_app_release_update.tar(1.18 MB, 下载次数: 0)



---------------------
作者:jinglixixi
链接:https://bbs.21ic.com/forum.php?mod=viewthread&tid=3464688
来源:21ic.com
此文章已获得原创/原创奖标签,著作权归21ic所有,任何人未经允许禁止转载。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 9:35:45

Langchain-Chatchat能否用于社交媒体内容审核辅助?

Langchain-Chatchat能否用于社交媒体内容审核辅助? 在当今社交媒体平台日均处理数亿条用户生成内容的背景下,如何高效、精准地识别违规信息已成为行业难题。从“你全家都不得好死”这类极端侮辱性言论,到披着隐喻外衣的仇恨表达,…

作者头像 李华
网站建设 2026/6/9 3:56:11

有没有简单好用的jenkins一样的工具

根据最新的社区讨论和工具评测,有几个比Jenkins更简单好用的CI/CD工具值得推荐:1. TeamCity(最推荐)特点:被多位开发者评价为"比Jenkins好用太多"、"不用怎么折腾的Jenkins"简单直观:图…

作者头像 李华
网站建设 2026/6/5 6:02:36

如何进入“项目根目录”?

在学习编程、跑脚本、装依赖或执行构建命令时,你经常会看到一句话:“请在项目根目录下执行……”。很多报错(比如找不到配置文件、路径不对、命令无效)其实都源于同一个原因:你没有站在项目的“家门口”——也就是项目…

作者头像 李华
网站建设 2026/6/8 13:18:49

Java毕设选题推荐:基于springboot的智慧城市管理中心平台道路监控设备管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/8 21:34:53

FaceFusion在AI导游系统中的多语言形象切换

FaceFusion在AI导游系统中的多语言形象切换 在智慧旅游快速发展的今天,游客不再满足于“听一段讲解”,而是期待与一位“看得见、有温度”的本地向导互动。然而,传统AI导游大多依赖预录视频或静态头像,面对全球用户时显得千篇一律—…

作者头像 李华
网站建设 2026/6/9 17:28:08

FaceFusion镜像提供模型版本回滚功能

FaceFusion镜像提供模型版本回滚功能 在AI生成内容(AIGC)工具快速迭代的今天,一个看似微小的技术决策——是否支持模型版本回滚,往往决定了整个系统的稳定性与可维护性。以开源人脸替换工具 FaceFusion 为例,其通过Doc…

作者头像 李华