埃隆·马斯克的xAI公司Grok聊天机器人即将支持上传照片获得文本回复

科技 2024-05-22 10:17 阅读:

埃隆·马斯克的人工智能公司xAI正在为其Grok聊天机器人增加多模态输入功能。这意味着,用户很快就可以将照片上传到Grok并接收基于文本的答案。

xAI在一篇博客文章中首次调侃了这一点,称Grok-1.5V将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了新模型的发布进度。

埃隆·马斯克的xAI公司Grok聊天机器人即将支持上传照片获得文本回复 第1张

在开发者文档中,一个Python脚本示范了开发人员如何使用xAI软件开发工具包库来生成基于文本和图像的回应。这个脚本读取图像文件,设置一个文本提示,并使用xAI SDK生成回应。

Grok最早于2023年11月发布,目前仅供购买高级会员订阅的用户使用。最后一次更新是在今年3月的Grok1.5版本,带来了改进的推理能力。

据xAI的一篇博文介绍,Grok-1模型是“基于来自互联网公开来源直至2023年第三季度以及由人类审核员审查和整理的各种文本数据”进行训练的。该博文补充说,Grok-1并未经过xAI的训练,但拥有“对世界的实时知识”,包括xAI上的帖子。

xAI在人工智能领域相对较新,并落后于竞争对手,如OpenAI的ChatGPT。然而,根据xAI的一篇博文,他们的Grok1.5模型正在缩小与GPT-4的差距,这些测试涵盖了从小学到高中各种竞赛题目的广泛范围。值得注意的是,大型语言模型的基准测试经常受到批评,因为如果这些基准测试包含在它们的训练数据中,这些模型就可以在基准测试上表现良好。