55_Spring AI 干货笔记之 OpenAI 语音转录-洪萨配资

一、OpenAI 语音转录

Spring AI 支持 OpenAI 的语音转录模型。

二、前置条件

您需要创建一个 OpenAI API 密钥以访问 ChatGPT 模型。请在 OpenAI 注册页面创建账户，并在 API 密钥页面生成令牌。Spring AI 项目定义了一个名为 spring.ai.openai.api-key 的配置属性，您应将其设置为从 openai.com 获取的 API 密钥值。

三、自动配置

Spring AI 的自动配置及其 Starter 模块的构件名称发生了显著变化。更多信息请参阅升级说明。

Spring AI 为 OpenAI 语音转录客户端提供了 Spring Boot 自动配置。要启用它，请将以下依赖项添加到项目的 Maven pom.xml 文件中：

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-starter-model-openai'}

请参考“依赖管理”部分，将 Spring AI BOM 添加到您的构建文件中。

3.1 转录属性

3.1.1 连接属性

前缀 spring.ai.openai 用作连接 OpenAI 的属性前缀。

对于属于多个组织的用户（或通过其旧版用户 API 密钥访问其项目的用户），可以选择指定用于 API 请求的组织和项目。这些 API 请求的使用量将计入指定组织和项目的用量。

3.1.2 配置属性

现在通过顶级属性 spring.ai.model.audio.transcription 来启用或禁用音频转录的自动配置。
要启用：spring.ai.model.audio.transcription=openai (默认已启用)
要禁用：spring.ai.model.audio.transcription=none (或任何非 openai 的值)
此项变更是为了支持配置多个模型。

前缀 spring.ai.openai.audio.transcription 用作属性前缀，用于配置 OpenAI 语音转录模型的重试机制。

您可以覆盖通用的 spring.ai.openai.base-url、spring.ai.openai.api-key、spring.ai.openai.organization-id 和 spring.ai.openai.project-id 属性。如果设置了 spring.ai.openai.audio.transcription.base-url、spring.ai.openai.audio.transcription.api-key、spring.ai.openai.audio.transcription.organization-id 和 spring.ai.openai.audio.transcription.project-id 属性，它们将优先于通用属性。这在您希望为不同模型和不同模型端点使用不同的 OpenAI 账户时非常有用。

所有以 spring.ai.openai.transcription.options 为前缀的属性都可以在运行时被覆盖。

四、运行时选项

OpenAiAudioTranscriptionOptions 类提供了进行转录时使用的选项。在启动时，会使用 spring.ai.openai.audio.transcription 指定的选项，但您可以在运行时覆盖这些选项。

例如：

OpenAiAudioApi.TranscriptResponseFormatresponseFormat=OpenAiAudioApi.TranscriptResponseFormat.VTT;OpenAiAudioTranscriptionOptionstranscriptionOptions=OpenAiAudioTranscriptionOptions.builder().language("en").prompt("Ask not this, but ask that").temperature(0f).responseFormat(this.responseFormat).build();AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=openAiTranscriptionModel.call(this.transcriptionRequest);

五、手动配置

将 spring-ai-openai 依赖项添加到项目的 Maven pom.xml 文件中：

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-openai'}

请参考“依赖管理”部分，将 Spring AI BOM 添加到您的构建文件中。

接下来，创建一个 OpenAiAudioTranscriptionModel

varopenAiAudioApi=newOpenAiAudioApi(System.getenv("OPENAI_API_KEY"));varopenAiAudioTranscriptionModel=newOpenAiAudioTranscriptionModel(this.openAiAudioApi);vartranscriptionOptions=OpenAiAudioTranscriptionOptions.builder().responseFormat(TranscriptResponseFormat.TEXT).temperature(0f).build();varaudioFile=newFileSystemResource("/path/to/your/resource/speech/jfk.flac");AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(this.audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=openAiTranscriptionModel.call(this.transcriptionRequest);

六、示例代码

OpenAiTranscriptionModelIT.java 测试文件提供了一些如何使用该库的通用示例。

YOLO训练任务通知机制？完成即推送到企业微信GPU群

YOLO训练完成自动推送至企业微信：构建高效的AI任务通知系统在深度学习项目中，一个看似微不足道的环节——“如何知道训练什么时候结束”——往往决定了整个团队的研发节奏。尤其是在使用多台GPU服务器并行训练YOLO模型时，工程师们常常面临这…

李华

YOLOv10采用Anchor-Free设计，简化部署流程

YOLOv10的Anchor-Free革新：让目标检测真正“即插即用” 在工业质检线上，一台AI相机正以每秒20帧的速度扫描着飞驰而过的电路板。成千上万个微型元件在镜头下闪过，系统必须在毫秒级时间内判断是否存在虚焊、错件或缺损——这不仅是对算法精度的…

李华

YOLO模型训练支持Checkpoint自动保存

YOLO模型训练支持Checkpoint自动保存在工业质检、智能监控和自动驾驶等真实场景中，一个目标检测模型的训练往往需要持续数小时甚至数天。想象一下：你部署了一个YOLO模型在服务器上训练缺陷产品图像，已经跑了三天，mAP正在稳步上升…

李华

YOLO模型部署边缘计算网关：低延迟实战

YOLO模型部署边缘计算网关：低延迟实战在一条高速运转的SMT贴片生产线上，每分钟有数百块PCB板通过检测工位。传统人工质检不仅效率低下，还因视觉疲劳导致漏检率高达15%以上。而一旦一块存在虚焊或缺件的电路板流入后续工序，可能引…

李华

YOLO模型训练资源申请流程：企业级GPU管理规范

YOLO模型训练资源申请流程：企业级GPU管理规范在智能制造工厂的质检线上，一台搭载YOLOv8s模型的工业相机正以每秒200帧的速度识别PCB板上的焊点缺陷。与此同时，数据中心里数十个类似的训练任务正在争夺有限的A100 GPU资源——这正是现代AI研发…

李华

【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略附Python代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

李华