OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

日期：2024-05-14 来源：IT之家评论：0

标签： 人工智能科技 AI

IT之家 5 月 14 日消息，OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o，该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是，GPT-4o 将免费提供给所有用户使用。

OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示，GPT-4o 将提供与 GPT-4 同等水平的智能，但在文本、图像以及语音处理方面均取得了进一步提升。

“GPT-4o 可以综合利用语音、文本和视觉信息进行推理，”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。GPT-4 是 OpenAI 此前的旗舰模型，可以处理由图像和文本混合而成的信息，并能完成诸如从图像中提取文字或描述图像内容等任务，GPT-4o 则在此基础上新增了语音处理能力。

GPT-4o 的运行速度将大大提升，最大亮点在于其语音交互模式采用了新技术。OpenAI 一直致力于让用户通过语音与 ChatGPT 进行交流，仿佛与真人对话一般。然而，之前的版本由于延迟问题，严重影响了对话的沉浸感。GPT-4o 则采用了全新的技术，让聊天 机器人对话的响应速度大幅提升。

IT之家注意到，发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后，GPT-4o 几乎可以即时回应，并通过文本转语音功能进行朗读，让对话感觉更加自然逼真。

另一个演示展示了 GPT-4o 根据要求调整说话时语气，GPT-4o 可以根据指令改变声音，从夸张戏剧到冰冷机械，展现了出色的可塑性。最后，演示还展示了 GPT-4o 的唱歌功能。

以往，OpenAI 发布新版 ChatGPT 模型时，通常会将其置于付费墙之后。不过这次 GPT-4o 将免费提供给所有用户，付费用户则可以享受五倍的调用额度。

此外，OpenAI 还发布了桌面版的 ChatGPT 和新的用户界面。“我们认识到这些模型正变得越来越复杂，” 穆拉蒂说道，“但我们希望用户与人工智能模型的交互体验能够更加自然、轻松，让用户可以将注意力完全集中在与模型的协作上，而无需在意界面本身。”

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 中美将举行人工智能政府间对话首次会议，交流科	• 科大讯飞：与华为、韩端机器人在人工智能领域始
• 人工智能会对经济造成全面影响？OpenAI 高管称	• 研究发现部分 AI 系统已学会“说谎”，未来或演
• 微软限制执法机构使用 Azure 人工智能进行实时	• 备战人工智能大赛！卓翼飞思实验室启动机器人挑
• 马斯克：人工智能目前在太空探索领域表现不佳	• 消息称三星将为 Galaxy S25 系列手机引入“电池
• 宜家宣布向人工智能化转型：开发专属 AI 工具、	• 清华大学成立人工智能学院，图灵奖获得者姚期智

恰佩克奖	机器人高峰论坛	机气林	开云入口网页版生态大会	ITES深圳工业展	机器人研究院	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会	国际现代工厂/过程自动化技术与装备展览会