news 2026/6/10 2:16:30

55_Spring AI 干货笔记之 OpenAI 语音转录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
55_Spring AI 干货笔记之 OpenAI 语音转录

一、OpenAI 语音转录

Spring AI 支持 OpenAI 的语音转录模型。

二、前置条件

您需要创建一个 OpenAI API 密钥以访问 ChatGPT 模型。请在 OpenAI 注册页面 创建账户,并在 API 密钥页面 生成令牌。Spring AI 项目定义了一个名为 spring.ai.openai.api-key 的配置属性,您应将其设置为从 openai.com 获取的 API 密钥值。

三、自动配置

Spring AI 的自动配置及其 Starter 模块的构件名称发生了显著变化。更多信息请参阅升级说明。

Spring AI 为 OpenAI 语音转录客户端提供了 Spring Boot 自动配置。要启用它,请将以下依赖项添加到项目的 Maven pom.xml 文件中:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-starter-model-openai'}

请参考“依赖管理”部分,将 Spring AI BOM 添加到您的构建文件中。

3.1 转录属性

3.1.1 连接属性

前缀 spring.ai.openai 用作连接 OpenAI 的属性前缀。

对于属于多个组织的用户(或通过其旧版用户 API 密钥访问其项目的用户),可以选择指定用于 API 请求的组织和项目。这些 API 请求的使用量将计入指定组织和项目的用量。

3.1.2 配置属性

现在通过顶级属性 spring.ai.model.audio.transcription 来启用或禁用音频转录的自动配置。

  • 要启用:spring.ai.model.audio.transcription=openai (默认已启用)

  • 要禁用:spring.ai.model.audio.transcription=none (或任何非 openai 的值)

此项变更是为了支持配置多个模型。

前缀 spring.ai.openai.audio.transcription 用作属性前缀,用于配置 OpenAI 语音转录模型的重试机制。

您可以覆盖通用的 spring.ai.openai.base-url、spring.ai.openai.api-key、spring.ai.openai.organization-id 和 spring.ai.openai.project-id 属性。如果设置了 spring.ai.openai.audio.transcription.base-url、spring.ai.openai.audio.transcription.api-key、spring.ai.openai.audio.transcription.organization-id 和 spring.ai.openai.audio.transcription.project-id 属性,它们将优先于通用属性。这在您希望为不同模型和不同模型端点使用不同的 OpenAI 账户时非常有用。

所有以 spring.ai.openai.transcription.options 为前缀的属性都可以在运行时被覆盖。

四、运行时选项

OpenAiAudioTranscriptionOptions 类提供了进行转录时使用的选项。在启动时,会使用 spring.ai.openai.audio.transcription 指定的选项,但您可以在运行时覆盖这些选项。

例如:

OpenAiAudioApi.TranscriptResponseFormatresponseFormat=OpenAiAudioApi.TranscriptResponseFormat.VTT;OpenAiAudioTranscriptionOptionstranscriptionOptions=OpenAiAudioTranscriptionOptions.builder().language("en").prompt("Ask not this, but ask that").temperature(0f).responseFormat(this.responseFormat).build();AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=openAiTranscriptionModel.call(this.transcriptionRequest);

五、手动配置

将 spring-ai-openai 依赖项添加到项目的 Maven pom.xml 文件中:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-openai'}

请参考“依赖管理”部分,将 Spring AI BOM 添加到您的构建文件中。

接下来,创建一个 OpenAiAudioTranscriptionModel

varopenAiAudioApi=newOpenAiAudioApi(System.getenv("OPENAI_API_KEY"));varopenAiAudioTranscriptionModel=newOpenAiAudioTranscriptionModel(this.openAiAudioApi);vartranscriptionOptions=OpenAiAudioTranscriptionOptions.builder().responseFormat(TranscriptResponseFormat.TEXT).temperature(0f).build();varaudioFile=newFileSystemResource("/path/to/your/resource/speech/jfk.flac");AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(this.audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=openAiTranscriptionModel.call(this.transcriptionRequest);

六、示例代码

OpenAiTranscriptionModelIT.java 测试文件提供了一些如何使用该库的通用示例。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 0:36:08

YOLO训练任务通知机制?完成即推送到企业微信GPU群

YOLO训练完成自动推送至企业微信&#xff1a;构建高效的AI任务通知系统 在深度学习项目中&#xff0c;一个看似微不足道的环节——“如何知道训练什么时候结束”——往往决定了整个团队的研发节奏。尤其是在使用多台GPU服务器并行训练YOLO模型时&#xff0c;工程师们常常面临这…

作者头像 李华
网站建设 2026/6/9 16:24:12

YOLOv10采用Anchor-Free设计,简化部署流程

YOLOv10的Anchor-Free革新&#xff1a;让目标检测真正“即插即用” 在工业质检线上&#xff0c;一台AI相机正以每秒20帧的速度扫描着飞驰而过的电路板。成千上万个微型元件在镜头下闪过&#xff0c;系统必须在毫秒级时间内判断是否存在虚焊、错件或缺损——这不仅是对算法精度的…

作者头像 李华
网站建设 2026/6/9 17:43:25

YOLO模型训练支持Checkpoint自动保存

YOLO模型训练支持Checkpoint自动保存 在工业质检、智能监控和自动驾驶等真实场景中&#xff0c;一个目标检测模型的训练往往需要持续数小时甚至数天。想象一下&#xff1a;你部署了一个YOLO模型在服务器上训练缺陷产品图像&#xff0c;已经跑了三天&#xff0c;mAP正在稳步上升…

作者头像 李华
网站建设 2026/6/9 17:41:27

YOLO模型部署边缘计算网关:低延迟实战

YOLO模型部署边缘计算网关&#xff1a;低延迟实战 在一条高速运转的SMT贴片生产线上&#xff0c;每分钟有数百块PCB板通过检测工位。传统人工质检不仅效率低下&#xff0c;还因视觉疲劳导致漏检率高达15%以上。而一旦一块存在虚焊或缺件的电路板流入后续工序&#xff0c;可能引…

作者头像 李华
网站建设 2026/6/9 17:40:40

YOLO模型训练资源申请流程:企业级GPU管理规范

YOLO模型训练资源申请流程&#xff1a;企业级GPU管理规范 在智能制造工厂的质检线上&#xff0c;一台搭载YOLOv8s模型的工业相机正以每秒200帧的速度识别PCB板上的焊点缺陷。与此同时&#xff0c;数据中心里数十个类似的训练任务正在争夺有限的A100 GPU资源——这正是现代AI研发…

作者头像 李华