Bilibot语音API集成:派蒙和林亦双语音模型配置详解
【免费下载链接】bilibotA local chatbot fine-tuned by bilibili user comments.项目地址: https://gitcode.com/GitHub_Trending/bi/bilibot
Bilibot是一个基于哔哩哔哩用户评论微调训练的本地聊天机器人,支持文字对话和语音生成功能。该项目集成了派蒙和林亦双语音模型,通过GPT-SoVITS技术实现高质量的语音合成。本文将详细介绍如何配置和使用这两个语音模型。
🎯 项目核心功能概述
Bilibot使用Qwen1.5-32B-Chat作为基础语言模型,通过mlx-lm框架进行微调训练。语音生成部分采用GPT-SoVITS技术,支持派蒙和林亦两种不同风格的语音输出。
项目文件结构清晰:
main/目录包含主要运行脚本data/samples/存放语音样本文件text/目录包含提示词模板和问题列表
📦 环境配置与安装
首先克隆项目仓库:
git clone https://gitcode.com/GitHub_Trending/bi/bilibot创建并激活Python环境:
conda create -n bilibot python=3.10 conda activate bilibot pip install -r requirements.txt🔧 语音API服务配置
派蒙语音模型配置
派蒙语音模型使用端口9880提供服务,配置命令如下:
python api.py -s SoVITS_weights/paimeng2_e110_s159940.pth -g GPT_weights/paimeng2-e10.ckpt -dr samples/Paimon/疑问—哇,这个,还有这个…只是和史莱姆打了一场,就有这么多结论吗?.wav -dt "哇,这个,还有这个…只是和史莱姆打了一场,就有这么多结论吗?" -dl "zh" -a 127.0.0.1 -p 9880林亦语音模型配置
林亦语音模型使用端口9881提供服务:
python api.py -s SoVITS_weights/linyi_e25_s1150.pth -g GPT_weights/linyi-e50.ckpt -dr "samples/linyi/【愤怒】你这问题太弱智了,我都不知道该从哪开始骂你。.WAV" -dt "你这问题太弱智了,我都不知道该从哪开始骂你。" -dl "zh" -a 127.0.0.1 -p 9881🎙️ 语音生成实现原理
在main/start_qa_dialogue.py中,语音生成功能通过generate_speech函数实现:
def generate_speech(text, port): data = { "text": text, "text_language": "zh" } response = requests.post("http://127.0.0.1:{}".format(port), json=data) # 音频处理和播放逻辑该函数向本地API服务发送文本数据,接收生成的音频流并进行播放。
🚀 运行问答对话程序
配置完成后,运行问答生成程序:
python start_qa_dialogue.py程序会自动从text/questions.txt读取问题列表,使用派蒙语音提问,生成回答后使用林亦语音播报。
💡 实用技巧与优化建议
- 性能优化:使用
tools/compress_model.py对模型进行量化压缩,显著提升生成速度 - 自定义问题:编辑
text/questions.txt文件添加自定义问题 - 语音样本:在
data/samples/目录下可以添加更多语音样本文件 - 模板定制:修改
text/chat_template.txt调整对话模板格式
🎉 结语
Bilibot的语音API集成提供了丰富的语音交互体验,派蒙和林亦双语音模型的配置相对简单但功能强大。通过本文的详细指导,您可以快速搭建属于自己的智能语音对话系统,享受AI带来的趣味交互体验。
【免费下载链接】bilibotA local chatbot fine-tuned by bilibili user comments.项目地址: https://gitcode.com/GitHub_Trending/bi/bilibot
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考