OpenAI发布GPT-4o，语音助手迈向全知时代-金财在线

OpenAI在春季更新活动中发布了全新的旗舰模型GPT-4o，代表着全知的意义。这一新模型使得ChatGPT能够处理50种不同的语言，同时提高了速度和质量，标志着人类与计算机交互迈出了更自然的一步。

据了解，GPT-4o支持文本、音频和图像的任意组合输入，并生成文本、音频和图像的任意组合输出。在音频输入方面，GPT-4o的响应时间最短为232毫秒，平均为320毫秒，与人类在对话中的响应时间相似，极大地提升了用户体验。此外，GPT-4o还可以根据用户要求变换语调，从急促的喘气声中理解情绪，并指导用户进行深呼吸，展现出了更加智能的交互能力。

目前，GPT-4o的文本和图像功能已经开始在ChatGPT中免费推出，而Plus用户更可以享受到5倍的调用额度，为用户带来更加便捷和高效的使用体验。这一新模型的发布，标志着语音助手迈向了全知时代，为人机交互带来了更加智能和便捷的体验。

调用语音助手 gpt-4 openai 视频生成模型