OpenAI发布GPT-4o,语音助手迈向全知时代

科技 2024-05-14 12:05 阅读:

OpenAI在春季更新活动中发布了全新的旗舰模型GPT-4o,代表着全知的意义。这一新模型使得ChatGPT能够处理50种不同的语言,同时提高了速度和质量,标志着人类与计算机交互迈出了更自然的一步。

据了解,GPT-4o支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。在音频输入方面,GPT-4o的响应时间最短为232毫秒,平均为320毫秒,与人类在对话中的响应时间相似,极大地提升了用户体验。此外,GPT-4o还可以根据用户要求变换语调,从急促的喘气声中理解情绪,并指导用户进行深呼吸,展现出了更加智能的交互能力。

目前,GPT-4o的文本和图像功能已经开始在ChatGPT中免费推出,而Plus用户更可以享受到5倍的调用额度,为用户带来更加便捷和高效的使用体验。这一新模型的发布,标志着语音助手迈向了全知时代,为人机交互带来了更加智能和便捷的体验。