news 2026/4/15 19:45:46

54_Spring AI 干货笔记之 Azure OpenAI 语音转录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
54_Spring AI 干货笔记之 Azure OpenAI 语音转录

一、Azure OpenAI 语音转录

Spring AI 支持 Azure Whisper 模型。

二、前置条件

从 Azure 门户的 Azure OpenAI 服务部分获取您的 Azure OpenAI 端点和 API 密钥。Spring AI 定义了一个名为 spring.ai.azure.openai.api-key 的配置属性,您应将其设置为从 Azure 获取的 API 密钥值。同时还有一个名为 spring.ai.azure.openai.endpoint 的配置属性,应设置为在 Azure 中部署模型时获取的端点 URL。

三、自动配置

Spring AI 的自动配置及其 Starter 模块的构件名称发生了显著变化。更多信息请参阅升级说明。

Spring AI 为 Azure OpenAI 语音转录生成客户端提供了 Spring Boot 自动配置。要启用它,请将以下依赖项添加到项目的 Maven pom.xml 文件中:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-azure-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-starter-model-azure-openai'}

请参考“依赖管理”部分,将 Spring AI BOM 添加到您的构建文件中。

转录属性

现在通过顶级属性 spring.ai.model.audio.transcription 来启用或禁用音频转录的自动配置。

  • 要启用:spring.ai.model.audio.transcription=azure-openai (默认已启用)

  • 要禁用:spring.ai.model.audio.transcription=none (或任何非 azure-openai 的值)

此项变更是为了支持配置多个模型。

前缀 spring.ai.openai.audio.transcription 用作属性前缀,用于配置 OpenAI 图像模型的重试机制。

四、运行时选项

AzureOpenAiAudioTranscriptionOptions 类提供了进行转录时使用的选项。在启动时,会使用 spring.ai.azure.openai.audio.transcription 指定的选项,但您可以在运行时覆盖这些选项。

例如:

AzureOpenAiAudioTranscriptionOptions.TranscriptResponseFormatresponseFormat=AzureOpenAiAudioTranscriptionOptions.TranscriptResponseFormat.VTT;AzureOpenAiAudioTranscriptionOptionstranscriptionOptions=AzureOpenAiAudioTranscriptionOptions.builder().language("en").prompt("Ask not this, but ask that").temperature(0f).responseFormat(this.responseFormat).build();AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=azureOpenAiTranscriptionModel.call(this.transcriptionRequest);

五、手动配置

将 spring-ai-openai 依赖项添加到项目的 Maven pom.xml 文件中:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-azure-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-azure-openai'}

请参考“依赖管理”部分,将 Spring AI BOM 添加到您的构建文件中。

接下来,创建一个 AzureOpenAiAudioTranscriptionModel

varopenAIClient=newOpenAIClientBuilder().credential(newAzureKeyCredential(System.getenv("AZURE_OPENAI_API_KEY"))).endpoint(System.getenv("AZURE_OPENAI_ENDPOINT")).buildClient();varazureOpenAiAudioTranscriptionModel=newAzureOpenAiAudioTranscriptionModel(this.openAIClient,null);vartranscriptionOptions=AzureOpenAiAudioTranscriptionOptions.builder().responseFormat(TranscriptResponseFormat.TEXT).temperature(0f).build();varaudioFile=newFileSystemResource("/path/to/your/resource/speech/jfk.flac");AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(this.audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=this.azureOpenAiAudioTranscriptionModel.call(this.transcriptionRequest);
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 3:36:41

YOLO镜像支持VPC网络隔离,增强安全性

YOLO镜像支持VPC网络隔离&#xff0c;增强安全性 在智能制造工厂的监控中心&#xff0c;一条实时视频流正被送入AI系统——摄像头捕捉到传送带上的产品缺陷瞬间&#xff0c;预警信息便已推送至运维终端。整个过程不到200毫秒&#xff0c;而更关键的是&#xff1a;这些涉及商业机…

作者头像 李华
网站建设 2026/4/12 11:34:14

YOLO模型训练资源抢占检测:识别异常占用行为

YOLO模型训练资源抢占检测&#xff1a;识别异常占用行为 在现代AI研发环境中&#xff0c;GPU集群早已成为支撑深度学习任务的“算力心脏”。然而&#xff0c;随着越来越多团队共享这些昂贵资源&#xff0c;一个隐性却日益严重的问题浮出水面&#xff1a;某些YOLO模型训练任务悄…

作者头像 李华
网站建设 2026/4/13 0:41:46

YOLO目标检测标注质量影响有多大?实验数据说话

YOLO目标检测标注质量影响有多大&#xff1f;实验数据说话 在工业质检车间的一次例行测试中&#xff0c;工程师发现YOLOv8模型对PCB板上细小铜毛刺的漏检率突然飙升。令人困惑的是&#xff0c;模型架构未变、训练参数如常——最终问题溯源竟指向一个看似微不足道的环节&#xf…

作者头像 李华
网站建设 2026/4/13 8:09:45

YOLO训练数据不平衡怎么办?GPU加速过采样方案

YOLO训练数据不平衡怎么办&#xff1f;GPU加速过采样方案 在工业质检线上&#xff0c;一台PCB板正高速通过视觉检测工位。系统识别出大量焊点异常&#xff0c;却频频漏掉一种罕见的微裂纹——这类缺陷只占历史样本的0.3%&#xff0c;模型“见得太少”&#xff0c;自然“认不出来…

作者头像 李华
网站建设 2026/4/10 9:35:23

YOLO在港口自动化中的应用:集装箱识别与定位

YOLO在港口自动化中的应用&#xff1a;集装箱识别与定位 在全球贸易持续扩张的背景下&#xff0c;港口作为物流枢纽的压力与日俱增。每天成千上万的集装箱在码头堆场中流转&#xff0c;传统依赖人工目视或半自动系统的识别与调度方式&#xff0c;早已难以应对高密度、快节奏的作…

作者头像 李华
网站建设 2026/4/5 20:13:39

YOLO目标检测中的自监督预训练:减少标注依赖

YOLO目标检测中的自监督预训练&#xff1a;减少标注依赖 在工业质检车间的流水线上&#xff0c;每天有数百万帧图像被摄像头记录下来——金属表面反光、电路板纹理复杂、产品姿态多变。这些画面构成了丰富的视觉数据池&#xff0c;却因缺乏标注而长期“沉睡”。与此同时&#…

作者头像 李华