经过多次推迟和延迟,OpenAI终于在 ChatGPT 中引入了一种新的语音模式。截至目前,该公司已开始向少数 ChatGPT Plus 用户推出该模式。OpenAI 的高级语音模式由最新的 GPT-4o AI 模型提供支持,提供实时响应、自然语音和感知用户情绪等功能。
高级语音模式原定于 6 月某个时候作为 alpha 版本发布,但 OpenAI 将发布时间推迟了一个月。该公司强调,新的语音模式将允许用户随时中断 AI 聊天机器人,并通过语音调制提供更自然的交互。OpenAI 还在 X 上分享了一个简短的视频,并重点介绍了如何在该功能激活后将其打开。
OpenAI 的新语音模式:其工作原理如下
先进的语音模式通过复杂的人工智能模型运行,其中用户的语音输入通过语音识别技术转换为文本。然后,ChatGPT 的语言模型处理该文本以生成合适的响应。然后,生成的文本通过文本转语音模型转换为女性声音。
目前,高级语音模式正在 ChatGPT Plus 的一小批用户中进行测试。OpenAI 表示,被选中接收此模式的用户将收到一封包含说明的电子邮件,并在他们的移动应用程序中发送一条消息。OpenAI 计划逐步增加更多用户,所有 Plus 用户都将在今年年底前获得语音模式。