中信建投:OpenAI发布GPT-4o大模型 重点发力多模态领域

科技 2024-05-16 10:27 阅读:

智通财经APP获悉,中信建投发布研报称,OpenAI举行春季发布会,重点发布GPT-4o大模型,性能达到GPT-4 Turbo水平,能够实现多模态实时交互。同时,GPT-4o、ChatGPT会员版等多项功能未来将对所有用户免费开放,并推出桌面及手机双端应用,有望凭借易用性持续提升用户量。该行认为,OpenAI模型再次升级,重点发力多模态领域,且免费使用有望推动AI产业加速发展。

中信建投主要观点如下:

事件

北京时间5月14日01:00,OpenAI举行春季发布会。重点内容包括:1)GPT-4o多模态大模型发布,可实时与用户进行语音/文字交互,基本无延迟;2)GPT-4o模型向免费用户开放;3)推出ChatGPT手机端及桌面端应用,交互便捷性提升。

OpenAI发布重磅产品GPT-4o,实现多模态实时交互。

作为GPT-4的迭代版本,GPT-4o能够接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出,实现多模态交互。得益于模型迭代GPT-4o能够最低在232毫秒,平均在320毫秒响应音频输入,较GPT-3.5平均2.8秒和GPT-4平均5.4秒的延迟极大程度优化,基本实现与用户交互无延迟。此外,在传统基准测试中,GPT-4o已在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,并在多语言、音频和视觉功能上达到了更高水平。GPT-4o也将开放API接口,相较于GPT-4 Turbo速度为2倍、价格便宜一半、速率限制达到5倍。

GPT-4o将免费开放,用户量有望迎来激增。

OpenAI专注于推进人工智能技术,并确保每个人可以从中受益,将直接向免费用户开放GPT-4o,实现多种功能。具体而言,ChatGPT 免费用户可以使用 GPT-4o访问以下功能,包括1)体验GPT-4级智能;2)获取来自模型和网络的回复;3)分析数据并创建图表;4)对拍摄内容进行反馈;5)上传文件寻求帮助总结、写作或分析;6)发现并使用GPT和GPT 商店;7)使用Memory打造更有帮助的体验。而Plus用户则较免费用户拥有高达5倍的消息限制,并将在未来几周内体验到新版语音模式 GPT-4o 的 alpha 版。我们认为,向免费用户开放GPT-4o有望加速AI产品的渗透速度,刺激用户量激增,从而逐渐构建AI生态,相关产品将直接受益。

桌面及手机双端应用,简化用户工作流程。

对于桌面端,OpenAI推出了适用于 macOS 的ChatGPT应用程序,用户能够使用键盘快捷键快速唤起,直接通过文字、语音以及截图向ChatGPT 提问;而对于手机端,据发布会及OpenAI官网演示,GPT-4o可以1)直接与用户无延迟对话,实时感知用户语气语态,即时做出回应;2)能够响应多人的对话,实现集体讨论,用户能够随时打断GPT的回答或提出意见;3)能够读取手机摄像头画面,感知周围环境。我们认为,GPT-4o在桌面及手机双端的应用,大幅提升了产品易用性,从而能够更自然的将AI融入用户生活,简化用户的工作流程。

投资建议:

OpenAI举行春季发布会,重点发布GPT-4o大模型,性能达到GPT-4 Turbo水平,能够实现多模态实时交互。同时,GPT-4o、ChatGPT会员版等多项功能未来将对所有用户免费开放,并推出桌面及手机双端应用,有望凭借易用性持续提升用户量。我们认为,OpenAI模型再次升级,重点发力多模态领域,且免费使用有望推动AI产业加速发展。

风险提示:

AI技术进展不及预期:如果AI技术的发展速度或相关产品的实际效果低于预期,将无法满足市场需求,影响行业规模的扩张;市场竞争风险:目前已有大量公司进入AI领域,大模型及应用产品层出不穷,竞争持续加剧,可能会导致行业利润空间被压缩,甚至出现恶性竞争;政策监管风险:大模型产品涉及大量的训练数据,政府或将出台更严格的AI技术和应用监管政策,增加企业合规成本和运营风险;地缘政治风险:目前国际环境波诡云谲,美国出台新法案拟限制开源AI大模型出口,可能会对行业造成不利影响。