news 2026/7/1 21:22:17

一个将本地视频/音频转换为文字或字幕文件的命令行工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
一个将本地视频/音频转换为文字或字幕文件的命令行工具

video-to-txt

一个将本地视频/音频转换为文字或字幕文件的命令行工具。支持自动语言检测与中文简繁转换,默认在本地运行,不需要申请任何 API Key。

Github 地址: video2audio2text: https://github.com/GaloisZhou/video2audio2text

功能

  • 提取视频音频为 MP3/WAV
  • 本地转录为字幕或纯文本(基于faster-whisper
  • 自动语言检测:中文/英语,含粤语启发式识别
  • 中文脚本转换:简体/繁体(基于opencc
  • 备用方案:OpenAI API(可选)

环境要求

  • Python: 支持 Python 3.8+ (已在 Python 3.13 测试通过)。
  • FFmpeg: 必须安装 FFmpeg 命令行工具。
    • macOS:brew install ffmpeg
    • Windows/Linux: 请参考 FFmpeg 官网安装并添加到 PATH。

安装

  1. 克隆或下载本项目。
  2. 安装 Python 依赖:
pipinstall-r requirements.txt pipinstallfaster-whisper

使用方法

命令行接口 (CLI)

运行main.py即可处理视频。

基本用法

提取音频并生成字幕(默认使用 base 模型,输出 srt 格式):

python main.py path/to/your/video.mp4
仅提取音频

如果不想要生成字幕,可以加上--audio-only参数:

python main.py path/to/your/video.mp4 --audio-only

使用 OpenAI API (解决本地安装问题)

如果本地openai-whisper安装失败(如在 Python 3.13 上),您可以使用 OpenAI API Key 来生成字幕:

# 方法 1: 通过命令行参数python main.py video.mp4 --api-key sk-xxxxxx# 方法 2: 通过环境变量 (推荐)exportOPENAI_API_KEY="sk-xxxxxx"python main.py video.mp4

注意:API 模式会产生费用,请参考 OpenAI 官方定价。

指定模型和格式

您可以指定 Whisper 模型大小(模型越大越准但越慢)和输出格式:

python main.py video.mp4 --model medium --format vtt
  • --model:tiny,base,small,medium,large
  • --format:srt,txt,vtt,tsv,json
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 18:13:55

Java计算机毕设之基于springboot的拍卖网站的设计与实现拍品展示、竞价交互、交割管理(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/7/1 11:09:32

【计算机毕业设计案例】基于springboot的茶食酒馆网站在线预订 + 菜品展示 + 会员管理(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/25 23:45:40

慢SQL分析与优化实战

慢SQL分析与优化实战一、发现问题:如何发现慢查询?慢查询的发现通常依赖于监控体系,不同规模团队分工不同:团队角色主要发现途径工具示例运维 / DBA主导监控。负责数据库整体健康度,通过监控平台主动发现、统计并告警慢…

作者头像 李华
网站建设 2026/6/25 18:38:26

计算机Java毕设实战-基于springboot的见山茶食酒馆网站菜品 / 茶酒品类管理茶食酒馆 “休闲社交 + 精致消费” 的场景需求【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/30 1:44:50

炸裂发布!AI应用架构师在金融市场AI监控系统的新成果

炸裂发布!AI应用架构师在金融市场AI监控系统的新成果 关键词:金融AI监控系统、实时异常检测、可解释AI、时间序列分析、风险预警、分布式架构、模型漂移检测 摘要:金融市场如同波涛汹涌的大海,每一秒都有数以亿计的交易在全球流动。传统监控系统如同老旧的灯塔,面对瞬息万…

作者头像 李华
网站建设 2026/6/30 19:05:51

2025最新!MBA论文必备10个AI论文平台深度测评

2025最新!MBA论文必备10个AI论文平台深度测评 2025年MBA论文写作工具测评:如何选择高效实用的AI平台 随着人工智能技术的不断进步,越来越多的MBA学生开始借助AI工具提升论文写作效率。然而,面对市场上琳琅满目的AI论文平台&#x…

作者头像 李华