news 2026/4/24 12:08:47

funasr_onnx asr语音转录使用案例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
funasr_onnx asr语音转录使用案例

参考:
https://github.com/modelscope/FunASR/blob/main/examples/industrial_data_pretraining/sense_voice/demo_onnx.py

安装:

pip install funasr_onnx


使用:

from pathlib import Path from funasr_onnx import SenseVoiceSmall from funasr_onnx.utils.postprocess_utils import rich_transcription_postprocess model_dir = "iic/SenseVoiceSmall" model = SenseVoiceSmall(model_dir, batch_size=10, quantize=True) wav_or_scp = [r"C:\Users\loong\Downloads\asr_example.wav"] res = model(wav_or_scp, language="auto", use_itn=True) print([rich_transcription_postprocess(i) for i in res])



版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 11:20:09

python趵突泉景区的智慧导游小程序 论文_5ztvv--(flask django Pycharm)

目录摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 智慧导游小程序作为现代旅游信息化的重要应用,结合趵突泉景区实际需求,基于Python技术栈&…

作者头像 李华
网站建设 2026/4/22 20:36:50

基于GLM-TTS的中英混合语音合成测试报告(含谷歌镜像加速技巧)

基于GLM-TTS的中英混合语音合成测试报告(含谷歌镜像加速技巧) 在短视频、播客与AI主播日益普及的今天,个性化语音生成已不再是实验室里的概念——越来越多的内容创作者开始寻求一种既能“像自己说话”,又能自然朗读中英文混杂文本…

作者头像 李华
网站建设 2026/4/17 18:59:17

java计算机毕业设计羊养殖管理平台 基于SpringBoot的羊场智能生产管理系统 绵羊产业链一站式信息化服务平台

计算机毕业设计羊养殖管理平台m68sg9 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。 散养、圈养、放牧交替,饲料配方、疫苗接种、接产记录、疾病诊疗、繁育档案全靠…

作者头像 李华
网站建设 2026/4/22 15:38:24

如何用GLM-TTS克隆方言语音?实测粤语、川渝话合成效果

如何用 GLM-TTS 克隆方言语音?实测粤语、川渝话合成效果 在智能语音助手越来越“标准”的今天,你是否也曾怀念过那一口地道的乡音?当导航用普通话提醒“前方路口右转”,如果换成一句“喂~转右啊老表!”会不…

作者头像 李华
网站建设 2026/4/20 21:48:52

GLM-TTS与MathType无直接关联?但都属于科研效率工具链

GLM-TTS:当语音合成遇上科研效率革命 你有没有试过一边跑步一边“读”一篇学术论文?或者在通勤路上听一本数学教材的讲解?这听起来像是未来场景,但今天的技术已经让它触手可及。关键就在于——如何把文字,尤其是那些夹…

作者头像 李华
网站建设 2026/4/22 15:43:16

【PHP区块链数据加密实战指南】:掌握5大核心加密算法与应用技巧

第一章:PHP区块链数据加密概述 在现代分布式系统中,区块链技术以其去中心化、不可篡改和可追溯的特性成为数据安全领域的重要支柱。PHP 作为一种广泛使用的服务器端脚本语言,虽然并非区块链开发的主流选择,但依然可以通过其强大的…

作者头像 李华