OpenAI发布全新GPT-4o模型,AI进入《她》时代?

科技 2024-05-14 10:50 阅读:

美国人工智能研究公司OpenAI在5月13日举行了“春季更新”活动,正式推出了新的旗舰人工智能模型GPT-4o,以及免费向用户提供更多ChatGPT功能。GPT-4o支持文本、音频和图像的任意组合输入,并能够生成文本、音频和图像的任意组合输出。OpenAI首席执行官奥尔特曼表示,GPT-4o的语音功能让人想起了电影《她》,并表示对其感到惊讶。

据报道,GPT-4o的速度比现有的GPT-4 Turbo快了两倍,但成本仅为其一半。GPT-4o可以实时对文本、音频和图像进行推理,响应时间几乎达到人类水平。OpenAI高管在发布会上演示了GPT-4o的多项功能,包括分析计算机代码、语言翻译、解决数学问题等。

GPT-4o还可以检测用户的情绪,并以类似人类或机器人的语调与用户交谈。然而,在演示过程中也出现了一些失误,显示出生成式人工智能的“幻觉”问题仍未得到解决。

GPT-4o的“o”代表“omni”,即“全能”之意。它可以在最快232毫秒的时间内响应音频输入,几乎接近人类在交谈中的响应时间。OpenAI表示,GPT-4o的英语和代码文本性能与GPT-4 Turbo相当,在非英语文本方面也有显著提高。

OpenAI还表示,GPT-4o是该公司首个结合所有这些模式的模型,在探索模型功能及其局限性方面仍处于起步阶段。

GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,付费订阅的ChatGPT Plus用户的消息数量上限是免费用户的5倍。新版语音模式也将在未来几周内向Plus用户推出。

在发布会结束后,OpenAI首席执行官奥尔特曼在其个人博客上发文称,GPT-4o的语音功能与电影《她》相似。这一新模型的推出似乎意味着,OpenAI和其他科技巨头正寻求扩大用户群体并获得更多的研究资金。

然而,AI技术的快速发展也引起了一些担忧,包括围绕版权问题的争议。OpenAI公司已经与一些媒体公司签署合作协议,但也面临来自其他媒体公司的诉讼。许多创作者也担心,AI大模型的训练涉及侵权问题。这些问题将在未来成为AI技术发展的挑战。