时间:2025/9/1 10:51:24来源:www.a300.cn作者:佚名我要评论(0)
OpenAI正式发布语音模型GPT-realtime。
据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。
官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、更具表现力的语音方面表现卓越。尤其在重复字母与数字、逐字朗读免责声明、语句间无缝切换语言等场景中,GPT-realtime展现出优秀的适应能力。
该模型还具备出色的上下文理解能力,可准确捕捉非语言线索(如笑声),并实时调整语音语气,实现诸如带法国口音的友好语调”或语速较快的专业语调”等多样化表达。
此外,GPT-realtime新增了Cedar”和Marin”两种语音风格,并对现有八种语音效果进行了全面优化。
相关视频
相关阅读 中国电信与阿里巴巴签署协议 将在云和AI基础设施等领域展开合作外媒:Meta 限制青少年使用 AI 聊天机器人苹果 iPhone 17、Air 与 Pro 发布时间表:最新细节全览微信:将对AI生成合成内容添加显式和隐式标识外媒曝莲花Emira插混版与V6升级车型将于2027年发布“智数融合”:电科金仓在2025数博会上展示AI与数据库创新成果微信悄悄上线AI播客,新闻主播们的活儿可能真要被抢了。小米服务发布公告 召回总计146891台充电宝
热门文章
外媒:Meta 限制青少年
Meta 计划推出超级政治
Claude Code网页版重磅
别再猜了!手把手教你
最新文章
OpenAI发布语音模型GP
微信:将对AI生成合成
外媒:Meta 限制青少年使用 AI 聊天机器人微信悄悄上线AI播客,新闻主播们的活儿可能小米AI眼镜新功能内测用户招募:支持支付宝AI模型库哪个好?2025年主流AI模型选型指南
人气排行 安卓模拟器BlueStacks安装使用教程编程语言排行榜2020年9月 TIOBE编程语言排行eclipse字体大小怎么设置 eclipse字体大小plsql developer怎么连接数据库 plsql deveTomcat9.0安装教程 Tomcat9.0环境变量配置方plsql developer怎么使用 plsql developerVisual Studio 2015环境搭建教程Eclipse优化设置教程 Eclipse优化设置技巧
查看所有0条评论>>