您现在的位置是:首页 > 快讯快讯

OpenAI发布语音Agent

zhoucl 2025-03-21 10:45:13 快讯 已有人查阅

导读今天凌晨1点,OpenAI进行了技术直播发布了三款全新语音模型,专用于开发语音AI Agent。两个是语音转文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一个是文本转语音模型GPT-40 Mini TTS。值得一提的是,开发者可以控制GPT-40 Mini TTS模型的语音情绪和风格。OpenAI为语音转文本API增添了强大的streaming模式,允许开发者将连续的音频流实时输入模型,模型也能实时返回连续的文本和响应,这种实时交互的特性对于需要即时反馈的应用场景

今天凌晨1点,OpenAI发布三款全新语音模型,专为开发语音AI Agent设计。其中包括两款语音转文本模型:GPT-40 Transcribe和GPT-4 Mini Transcribe,以及一款文本转语音模型GPT-40 Mini TTS。开发者可控制GPT-40 Mini TTS的语音情绪与风格。此外,OpenAI为语音转文本API新增streaming模式,支持实时输入连续音频流并返回文本响应,适用于实时语音对话系统和会议转写等场景。

本文标签:

很赞哦! ()