Fun-ASR识别历史管理功能,查找记录超方便
你有没有过这样的经历:昨天刚转写完一段会议录音,今天想回看结果,却怎么也找不到——文件名记不清、时间对不上、浏览器关了就没了?或者批量处理了30个客服音频,导出的CSV堆在下载文件夹里,翻半天才找到第17条的识别结果?别急,Fun-ASR 的「识别历史」模块,就是专治这种“找不着”的焦虑。
它不是简单的日志列表,而是一套轻量但完整的本地记录管理系统:支持关键词搜索、ID精准定位、详情一键展开、批量清理,甚至能直接导出原始数据。更重要的是,所有操作都在浏览器里完成,无需打开数据库、不用写SQL、不依赖外部工具——真正做到了“点一下,就找到”。
本文将带你从零用起,彻底掌握 Fun-ASR 的识别历史功能。不讲原理、不堆参数,只说你每天会遇到的真实场景:怎么快速翻到上周三那条销售培训录音?怎么确认某句“客户投诉”是否被准确识别?怎么安全清空半年前的测试记录?答案全在这里。
1. 为什么你需要认真对待“识别历史”
很多人第一次打开 Fun-ASR,直奔“语音识别”或“批量处理”,把“识别历史”当成一个可有可无的角落功能。但实际用上一周后,90% 的用户都会回来重新点开它——因为历史记录,是整个语音识别工作流的“记忆中枢”。
它解决的不是技术问题,而是人的问题:
- 时间错位:你记得内容,但忘了哪天上传的;你记得时间,但忘了当时用了什么热词;
- 结果分散:单次识别结果在页面上一闪而过,批量处理结果导出成多个文件,VAD分段后的子片段又单独保存……信息四散,难以归集;
- 验证成本高:发现某句识别不准,想复现当时的参数设置和原始音频,却要靠截图、手记、猜路径;
- 协作断层:团队共用一台 Fun-ASR 服务器时,没人知道谁处理过什么,结果是否已被覆盖或修改。
Fun-ASR 的识别历史模块,正是为这些真实痛点而生。它不追求炫酷界面,但每项设计都指向一个目标:让每一次识别,都有迹可循、有据可查、有法可溯。
而且它完全本地化运行——所有记录存在你自己的机器上(webui/data/history.db),不上传、不联网、不依赖云服务。你的语音内容、识别结果、热词配置,全部留在本地 SQLite 数据库中,隐私和可控性拉满。
2. 五步上手:从看到用,不到2分钟
Fun-ASR WebUI 启动后,默认进入语音识别页。要访问识别历史,只需点击顶部导航栏的「识别历史」标签。整个过程无需重启、无需配置,打开即用。
下面用最直白的操作语言,带你走一遍完整流程:
2.1 查看最近100条记录(默认视图)
页面加载后,你会看到一个简洁的表格,按时间倒序排列,显示最近100条识别记录。每行包含5个核心字段:
- ID:系统自动生成的唯一编号(如
#142),全程使用,不重复、不跳号; - 时间:精确到秒的识别完成时间(如
2025-04-12 14:36:22); - 文件名:上传时的原始文件名(如
产品培训_20250412.mp3),若为麦克风录音,则显示mic_recording_20250412_143622.wav; - 识别结果(摘要):截取前50个字符的识别文本,足够判断内容主题;
- 语言:本次识别所选的目标语言(中文/英文/日文)。
小技巧:滚动鼠标滚轮可快速浏览,无需翻页;点击任意一列标题(如“时间”)可升序/降序切换,方便按时间或文件名排序。
2.2 搜索:输入关键词,秒级过滤
当你需要找某条特定记录时,不必一页页翻。页面右上角有一个搜索框,输入任意关键词,系统会同时匹配文件名和识别结果内容。
比如:
- 输入
培训→ 所有含“培训”的文件名(如销售培训.mp3)和识别结果(如“本次培训重点讲解了…”)都会被高亮显示; - 输入
2025-04-10→ 精准定位该日期的所有记录; - 输入
客服电话→ 即使你没在文件名里写,只要识别结果中出现这四个字,就会被搜到。
搜索是实时的,输入过程中表格自动刷新,毫秒级响应。没有“搜索中…”等待,也没有模糊匹配失败的挫败感。
2.3 查看详情:点开一条,看到全部
在表格中找到目标记录后,点击其右侧的「查看详情」按钮(或直接点击 ID 编号),页面下方会立即展开一个详情面板,显示该次识别的全部原始信息:
- 文件路径:本地绝对路径(如
/home/user/funasr/webui/data/uploads/20250412/产品培训_20250412.mp3),方便你直接定位音频源文件; - 完整识别结果:未经截断的全文本,支持复制、全选、滚动查看;
- 规整后文本:如果当时启用了 ITN,这里会显示转换后的规范文本(如“二零二五年”→“2025年”),并标注 ITN 开关状态;
- 热词列表:当时输入的热词(每行一个),原样呈现,帮你复盘为何某些词识别更准;
- 参数快照:包括目标语言、是否启用 VAD、模型设备(cuda/cpu/mps)、批处理大小等关键配置。
注意:这个详情页是只读的,不会触发任何新识别或修改操作,纯粹用于查阅与验证。
2.4 删除单条记录:谨慎但简单
如果你确认某条记录已无价值(比如测试用的噪音录音、误传的错误文件),可以精准删除它。
操作路径:在详情面板底部,点击「删除选中记录」→ 弹出二次确认对话框 → 输入该记录的 ID(如#142)→ 点击「确认删除」。
系统会严格校验 ID 是否匹配,防止误删。删除成功后,表格自动刷新,该记录立即消失,且不可恢复。
2.5 清空所有记录:一键重置,适合长期使用者
当 Fun-ASR 运行数月后,历史记录可能积累上千条,占用数据库空间,影响搜索速度。此时,“清空所有记录”就是最高效的整理方式。
位置:页面右上角,搜索框旁边,红色按钮「清空所有记录」。
警告:此操作永久删除数据库中全部记录,且无法撤销。点击后会弹出强提示框,要求你手动输入CONFIRM并勾选“我已知晓风险”复选框,才能执行。
建议做法:清空前先点击「导出全部」(见下节),将重要记录备份为 CSV,再执行清空。这样既释放空间,又保留关键数据。
3. 实用技巧:让历史管理真正为你省时间
光会用还不够,下面这些技巧,能让你从“会查”升级到“秒查”、“预判查”、“批量查”。
3.1 给文件命名加时间戳,搜索效率翻倍
Fun-ASR 不强制要求文件名格式,但一个好习惯能极大提升后期检索效率。建议在上传前,给音频文件加上清晰的时间+场景标识:
录音.mp3(毫无信息量)20250412_销售晨会_张经理.mp320250415_客服质检_订单号123456.wav
这样,即使你不记得具体内容,输入20250412或晨会,就能立刻锁定目标。
3.2 利用“规整后文本”反向验证 ITN 效果
ITN 功能是否真的按你预期工作?别靠猜。在详情页中,对比「完整识别结果」和「规整后文本」两栏,就能一目了然:
- 如果“五十块”变成了“50元”,说明数字规整生效;
- 如果“第三点”被改成“3点”,说明上下文判断未触发,可能需要调整热词或关闭 ITN;
- 如果某句口语(如“咱下午三点碰一下”)规整后变成“咱下午3:00碰一下”,说明时间表达识别+转换均正常。
这种对比,是优化 ITN 配置最直接的依据。
3.3 批量导出:把历史变成可分析的数据
点击页面右上角的「导出全部」按钮,Fun-ASR 会生成一个标准 CSV 文件,包含以下字段:
| 字段名 | 说明 |
|---|---|
| id | 记录ID |
| timestamp | 识别完成时间(ISO格式) |
| filename | 原始文件名 |
| filepath | 本地绝对路径 |
| language | 目标语言 |
| raw_text | 完整识别结果 |
| itn_text | 规整后文本(若启用) |
| hotwords | 热词列表(以“ |
| device | 使用的计算设备(cuda/cpu/mps) |
这个 CSV 可以直接导入 Excel 做统计(比如统计各语言识别数量)、用 Python 分析错误模式(比如高频错词提取)、或导入数据库建立自己的语音知识库。
示例:用 Excel 筛选
language=中文且itn_text包含“元”的记录,就能快速找出所有涉及金额的客服通话,为质检提供数据支撑。
3.4 数据库备份:30秒搞定,防丢无忧
所有历史记录都存于webui/data/history.db,这是一个标准 SQLite 文件。定期备份它,等于给你的语音资产上了保险。
操作极简:
# 进入 Fun-ASR 根目录 cd /path/to/funasr # 复制当前数据库(带时间戳) cp webui/data/history.db webui/data/history_backup_$(date +%Y%m%d_%H%M%S).db备份文件可存于 NAS、网盘或另一台机器。万一误删或数据库损坏,只需替换回备份文件,重启 Fun-ASR,历史记录瞬间还原。
4. 常见问题与避坑指南
即使功能清晰,新手在使用中仍可能遇到几个典型卡点。以下是真实用户高频提问的解答,附带实操建议。
4.1 Q:搜索不到某条记录,明明记得刚识别过?
A:请检查三个地方:
- 是否在其他浏览器标签页操作?Fun-ASR 的历史记录是全局的,但页面需刷新才能同步最新状态。关闭所有 Fun-ASR 标签页,重新打开「识别历史」页;
- 是否识别尚未完成?页面顶部有进度条或“正在识别中”提示,此时记录还未写入数据库。等待识别完成(出现结果文本)后再查;
- 是否上传了空音频或静音文件?Fun-ASR 对无效音频会跳过识别,不生成记录。可用 Audacity 打开文件确认波形。
4.2 Q:导出的 CSV 中,中文显示为乱码?
A:这是 Excel 默认编码问题。正确打开方式:
- 在 Excel 中,点击「数据」→「从文本/CSV」→ 选择文件 → 在导入向导中,将「文件原始格式」设为
UTF-8→ 完成; - 或直接用 VS Code、Notepad++ 等编辑器打开,确认内容正常后再复制粘贴。
4.3 Q:清空记录后,磁盘空间没变小?
A:SQLite 数据库删除记录后,空间不会自动返还给操作系统,而是标记为“可重用”。执行一次 VACUUM 即可彻底收缩:
# 进入数据库所在目录 cd webui/data # 使用 sqlite3 命令行工具压缩 sqlite3 history.db "VACUUM;"执行后,数据库文件体积会显著减小。
4.4 Q:多人共用一台 Fun-ASR,如何区分各自记录?
A:Fun-ASR 当前版本不内置用户系统,但可通过命名策略隔离:
- 每人使用专属前缀:
张三_20250412_会议.mp3、李四_20250412_访谈.wav; - 在热词列表第一行添加署名:
#张三-销售部(Fun-ASR 会原样保存,搜索#张三即可筛选); - 定期导出各自的 CSV,按人归档。
未来版本有望加入多用户支持,但现阶段,命名即权限。
5. 总结:让每一次语音,都成为可追溯的知识资产
Fun-ASR 的识别历史功能,表面看是一个“记录列表”,深层却承载着语音工作流的可追溯性、可验证性与可沉淀性。
它让你不再依赖临时记忆或零散截图;
它让一次识别的结果,能随时被复现、被验证、被复用;
它把碎片化的语音转写,转化成结构化的、可搜索的、可分析的数据资产。
从今天开始,你可以这样做:
- 每次识别前,花3秒给文件起个好名字;
- 关键任务完成后,顺手点一下「导出全部」,存档当周记录;
- 每月第一个工作日,执行一次数据库备份 + VACUUM;
- 团队内部约定热词署名规则,让协作更透明。
这些微小习惯,叠加起来,就是专业语音工作流的基石。
识别历史,不是功能的终点,而是你构建私有语音知识库的第一步。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。