OpenAI发布GPT-4o后,各项基准测试表现远超Gemini和Claude,多模态功能更是引人瞩目。在LMSys聊天机器人竞技场上,GPT-4o以1310分稳居第一,远超第二名GPT-4-turbo的1253分。而在多模态领域的基准Reka Vibe-Eval测试中,GPT-4o更是高出Gemini Pro1.5将近三个百分点。此外,GPT-4o在「针里寻针」测试中表现出色,正确率每个token位置上都不低于80%,一度接近100%。这种突破性能力让人们重新认识了GPT-4o的实力。
GPT-4o不仅在多领域SOTA表现出色,还在多模态功能方面远超市场上其他产品。作为原生多模态模型,GPT-4o的文生图效果非常惊艳,甚至超过了DALLE和MidJourney。在生成图片上的文字时,GPT-4o不仅做到文字的连续性,还能在之前生成图像的基础上进行迭代。此外,GPT-4o还能生成独立的角色形象,并进行对话互动,展现出强大的多模态功能。
除了在技术能力上的突破,GPT-4o的发布会也引发了对模型架构的猜测和热烈讨论。一些人认为模型架构与GPT-4类似,而另一些人则认为底层架构有重大变动,目标是在推理和多模态方面相比GPT-4有更多提升。这种猜测也成为了人们关注的焦点之一。
同时,开源与闭源之争也成为了热议话题。虽然GPT-4o的ChatGPT聊天界面及其API已经免费开放给用户使用,但OpenAI依旧坚持了不开源的传统。这种开源和闭源模型差距越来越大的趋势,也引发了人们对AI行业整体发展的思考。随着大模型之战愈演愈烈,相信对于开源和闭源的激烈讨论依旧会持续下去。