您的位置:首页资讯软件新闻 → 微软正式发布 GPT-realtime 模型,主打更逼真语音与多模态输入

微软正式发布 GPT-realtime 模型,主打更逼真语音与多模态输入

时间:2025/9/5 10:02:59来源:www.a300.cn作者:学臣我要评论(0)

微软正式宣布,其最新的语音转语音 (S2S) 模型 GPT-realtime 已在 Azure AI Foundry 平台上正式发布。这款新模型将微软在语音技术方面的多项改进整合到一个统一的产品中,其核心优势聚焦于自然的语言处理、卓越的音频质量以及更精准的指令跟随能力。

开发者现在可以通过全新的 Real-time API 访问 GPT-realtime。该模型旨在提供更自然、富有表现力的语音输出和更高质量的音频体验。作为此次发布的一部分,微软还推出了两种全新的语音选项——Marin 和 Cedar,旨在为用户带来逼真且清晰的语音合成效果。

微软在公告中强调了新模型的几项关键改进,包括增强的功能调用能力、更高的指令执行准确性,以及创新的图像输入支持。这项新功能允许用户在语音对话中加入图像并进行讨论,从而实现多模态交互,而无需依赖视频流。

除了技术层面的升级,微软还对定价模型进行了调整。与之前的 gpt-4o-realtime 预览版本相比,正式版的 gpt-realtime 价格降低了20%,成本将依据每百万代币(token)的使用量进行计算。

此次发布标志着微软正致力于为广大开发者和企业扩展其实时 AI 能力。通过将富有表现力的语音合成、高质量音频和多模态输入相结合,GPT-realtime 有望为从高级客户支持系统到创新的辅助功能工具等广泛的应用场景提供强大的技术支持。


相关视频

    没有数据

相关阅读 OPPO A6 Pro定档 9 月 9 日发布:开启手机六年耐用新时代华为发布首款MateTV:超薄设计搭载旗舰性能 8999元起预售​微软Copilot Appearance即将面向更广泛用户推广奥特曼:OpenAI的Codex使用量激增10倍,凸显GPT-5的强大影响力DeepL 推出企业级 AI 智能体,挑战 OpenAI 与微软小米澎湃OS 3首批Beta版更新“3.0.0.24”发布苹果发布 iOS 26 的第六个公开测试版:“液态玻璃”设计首次贯穿ChatGPT 即将推出家长控制功能!让青少年安全使用 AI 助手

文章评论
发表评论

热门文章 微软正式发布 GPT-reaChatGPT 即将推出家长澎湃OS 3发布 雷军喊话华为FreeBuds 7i无线耳

最新文章 奥特曼:OpenAI的Code微软正式发布 GPT-rea OpenAI 收购开发数据分析平台 Statsig, 每ChatGPT 即将推出家长控制功能!让青少年安小米澎湃OS 3超级岛很快更新:接入更多三方先后打通苹果、微软!小米澎湃OS 3互联服务

人气排行 2020年放假安排时间表全年图 2020年法定节假2021年放假安排时间表全年图 2021年法定节假微信公众号怎么申请 微信公众号申请要钱吗zune怎么用?zune使用攻略!2014台式机装机配置推荐微信朋友圈三天可见怎么破解 朋友圈仅展示三snmp协议在windows下的安装与配置2016猴年邮票多少钱一套 2016猴年邮票价格表