Bilibot语音API集成：派蒙和林亦双语音模型配置详解-洪萨配资

Bilibot语音API集成：派蒙和林亦双语音模型配置详解

【免费下载链接】bilibotA local chatbot fine-tuned by bilibili user comments.项目地址: https://gitcode.com/GitHub_Trending/bi/bilibot

Bilibot是一个基于哔哩哔哩用户评论微调训练的本地聊天机器人，支持文字对话和语音生成功能。该项目集成了派蒙和林亦双语音模型，通过GPT-SoVITS技术实现高质量的语音合成。本文将详细介绍如何配置和使用这两个语音模型。

🎯 项目核心功能概述

Bilibot使用Qwen1.5-32B-Chat作为基础语言模型，通过mlx-lm框架进行微调训练。语音生成部分采用GPT-SoVITS技术，支持派蒙和林亦两种不同风格的语音输出。

项目文件结构清晰：

main/目录包含主要运行脚本
data/samples/存放语音样本文件
text/目录包含提示词模板和问题列表

📦 环境配置与安装

首先克隆项目仓库：

git clone https://gitcode.com/GitHub_Trending/bi/bilibot

创建并激活Python环境：

conda create -n bilibot python=3.10 conda activate bilibot pip install -r requirements.txt

🔧 语音API服务配置

派蒙语音模型配置

派蒙语音模型使用端口9880提供服务，配置命令如下：

python api.py -s SoVITS_weights/paimeng2_e110_s159940.pth -g GPT_weights/paimeng2-e10.ckpt -dr samples/Paimon/疑问—哇，这个，还有这个…只是和史莱姆打了一场，就有这么多结论吗？.wav -dt "哇，这个，还有这个…只是和史莱姆打了一场，就有这么多结论吗？" -dl "zh" -a 127.0.0.1 -p 9880

林亦语音模型配置

林亦语音模型使用端口9881提供服务：

python api.py -s SoVITS_weights/linyi_e25_s1150.pth -g GPT_weights/linyi-e50.ckpt -dr "samples/linyi/【愤怒】你这问题太弱智了，我都不知道该从哪开始骂你。.WAV" -dt "你这问题太弱智了，我都不知道该从哪开始骂你。" -dl "zh" -a 127.0.0.1 -p 9881

🎙️ 语音生成实现原理

在main/start_qa_dialogue.py中，语音生成功能通过generate_speech函数实现：

def generate_speech(text, port): data = { "text": text, "text_language": "zh" } response = requests.post("http://127.0.0.1:{}".format(port), json=data) # 音频处理和播放逻辑

该函数向本地API服务发送文本数据，接收生成的音频流并进行播放。

🚀 运行问答对话程序

配置完成后，运行问答生成程序：

python start_qa_dialogue.py

程序会自动从text/questions.txt读取问题列表，使用派蒙语音提问，生成回答后使用林亦语音播报。

💡 实用技巧与优化建议

性能优化：使用tools/compress_model.py对模型进行量化压缩，显著提升生成速度
自定义问题：编辑text/questions.txt文件添加自定义问题
语音样本：在data/samples/目录下可以添加更多语音样本文件
模板定制：修改text/chat_template.txt调整对话模板格式

🎉 结语

Bilibot的语音API集成提供了丰富的语音交互体验，派蒙和林亦双语音模型的配置相对简单但功能强大。通过本文的详细指导，您可以快速搭建属于自己的智能语音对话系统，享受AI带来的趣味交互体验。

【免费下载链接】bilibotA local chatbot fine-tuned by bilibili user comments.项目地址: https://gitcode.com/GitHub_Trending/bi/bilibot

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

SpotifyPremium桌面版：无广告音乐体验完整指南

SpotifyPremium桌面版：无广告音乐体验完整指南【免费下载链接】SpotifyPremium Desktop MOD (ad free) 项目地址: https://gitcode.com/gh_mirrors/sp/SpotifyPremium 想要在Spotify上享受纯净无干扰的音乐体验吗？SpotifyPremium桌面MOD为你提供…

李华

高可靠机器人Wi-Fi客户端-核心技术篇

随着AGV，运维机器人，机器狗，巡检机器人等智能设备走向工业规模化部署，逐步代替人工从事柔性生产环节，日常巡检等各类作业。机器人的智能化水平不断提升、数量规模不断扩大，对无线通信提出了毫秒级低延迟、零…

李华

Gemini 能生成代公式的 WORD 文档吗？借助 AI 导出鸭可高效完成文档格式规整导出操作

Gemini能生成带公式的Word文档吗？——AI对话结构化导出技术架构深度测评作为一名从业15年的企业级系统架构师，我日常工作中大量依赖大模型辅助技术文档、算法设计和科研报告撰写。Gemini作为Google生态的重要一员，在多模态理解和长上下文处理…

李华

2007-2024年上市公司企业家信心指数

“企业家信心指数”是基于文本分析方法构建的量化指标，旨在刻画企业管理层对企业未来经营状况、宏观经济形势及市场发展前景的主观预期与信心水平，为研究企业经营预期、投资决策及宏观经济波动提供可量化的微观证据。基于此数据集，可系统开展…

李华

PotPlayer字幕翻译插件：5分钟实现免费实时双语字幕的终极方案

PotPlayer字幕翻译插件：5分钟实现免费实时双语字幕的终极方案【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还在为外语视…

李华

别再只盯着COF了！聊聊手机/电视窄边框背后的‘隐形功臣’：GOA技术详解

别再只盯着COF了！聊聊手机/电视窄边框背后的‘隐形功臣’：GOA技术详解当你在商场被一款"无边框"电视的沉浸式视觉效果震撼，或为手机屏幕上那道几乎消失的黑色边框惊叹时，可能不会想到——这些极致美学体验的背后&#x…

李华