华为盘古大模型5.0登场 具身智能加速人形机器人迈向通用

科技 2024-06-21 19:19 阅读:

21世纪经济报道记者 林典驰 倪雨晴 深圳、东莞报道

6月21日,乐聚人形机器人夸父与华为常务董事、华为云CEO张平安来了一场人机对话,夸父识别需求,准确完成击掌和递水等互动演示。

实现这一能力正是基于盘古大模型的赋能。在华为开发者大会2024上,张平安发布了盘古大模型5.0,在全系列、多模态、强思维三个方面进行升级。

盘古5.0还推出适配不同业务场景多种规格模型,加速大模型行业落地。据介绍,十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、低成本的推理场景。

千亿级参数的Pangu U系列适用于处理复杂任务,可以成为企业通用大模型的底座;万亿级参数的Pangu S系列超级大模型是处理跨领域多任务的超级大模型能帮助企业更好地在全场景应用AI技术。

其中,人形机器人是重要场景之一。据悉,通过模仿学习策略,华为云与乐聚公司提升了人形机器人的双臂操作能力,实现了软硬件层面的协同优化,不仅增强了机器人综合性能,还克服了小样本数据训练的局限性,推动了泛化操作能力的边界。

张平安表示,盘古具身智能大模型,可以让机器人完成十步以上的复杂任务规划,并在任务规划中实现多任务处理。并且,还可以使用这个大模型来生成机器人所需要的多模态数据,让机器人提前训练和学习各种复杂的场景。

今年伊始,从Figure 01与Open AI联合、英伟达在GTC大会发布人形机器人通用基础模型“Project GR00T”到马斯克在特斯拉2024年股东大会上表示特斯拉的人形机器人将采用大语言模型,“大模型+人形机器人”热浪不断,国内外大厂纷纷入局卷得如火如荼。

据21世纪经济报道记者多方了解,华为云与乐聚的合作起源于2024年3月,双方就“盘古具身智能大模型+夸父人形机器人”展开沟通。

4月,双方通过拟定家庭、工业等场景中示范应用案例孵化为探索目标展开了集智攻关,目前研发进程中已经打通了人形机器人数据收集、云端训练、部署推理的工作流程,形成了系列工具链。

其中,华为云和乐聚调研亨通线缆车间发现,工厂存在招工用工难、非标工序自动化难、部分危险场景安全隐患等业务痛点。例如,电测工序有强压强电风险,以及沾锡、灌锡等场景下存在有毒有害、高温强噪等情况。

这给人形机器人带来潜在需求,目前双方正以扫码包装、物流搬运、沾锡工序等作为典型场景进行验证。

“站在企业的角度,我们是希望人形机器人的发展能够解决传统产业招工难、特种行业高危作业的问题,将人从危险、繁复的工作中释放出来,去从事更安全、有趣、有创造性的工作,并通过产学研用的拉通,助推人形机器人产业化加速。”乐聚机器人副总裁柯真东表示。

另一方面,在家庭场景方面,双方以炒菜、扫地等生活中常见的家务为典型案例,联动智能家居设备进行配合完成任务。

以自动炒菜任务为例,盘古具身智能大模型为人形机器人与自动炒菜机赋能,让设备间能够拥有共同的大脑。

乐聚机器人有关人士透露,在盘古具身智能大模型具身Agent框架下,机器人可以自主完成从场景理解、自然语言指令识别、任务规划的具身规划,到双臂协同、自主执行、可泛化操作的具身执行的全流程任务。