Google I/O发布会：AI模型全面更新，覆盖多个生成模型类型-金财在线

5月15日消息，Google在昨晚的I/O开发者大会上发布了一系列AI模型的更新，涵盖了从文本到视觉和音乐的多个领域。其中Gemini1.5Pro支持200万上下文，针对翻译、编码、推理等关键用例进行了质量改进，但未发布测试结果。Gemini Flash则针对响应速度至关重要的窄或高频任务进行了优化，价格比GPT-3.5更便宜。

Gemini模型家族包括Ultra、Pro、Flash和Nano等多个版本，覆盖了不同的使用场景。Gemini Gems是谷歌的GPTs，支持自定义与Gemini的互动方式。Gemini Live则是基于声音的深入双向对话能力，为Project Astra实时视频理解个人助理聊天机器人提供支持。此外，Gemma2将于6月发布，规模为27B，提供接近Llama-3-70B的性能。PaliGemma是谷歌的第一个视觉语言开放模型，灵感来自PaLI-3。Veo是DeepMind开发的模型，旨在对标Sora，但一些体验者认为效果不尽人意。Imagen3是一款图像模型，能够理解自然书写的提示，生成高质量逼真图像，并在渲染文本方面表现优异。Music AI Sandbox是一个旨在改变音乐创作方式的AI工具，用户可以全新创作乐器部分，轻松转换不同曲目风格。最新的Trillium是谷歌的最新TPUs，计算性能比上一代TPU v5e提升高达4.7倍。

这次发布会展示了Google在AI领域的全面布局和创新能力，从文本到视觉再到音乐，Google的AI模型正在不断进步，为用户带来更加丰富和高效的体验。

Google I/O发布会：AI模型全面更新，覆盖多个生成模型类型

相关推荐：

最近发表

previous