VLA进化后降维打击!双手拣货,漂移操作,太空舱直接开上街
AI 视频教程

VLA进化后降维打击!双手拣货,漂移操作,太空舱直接开上街

量子位 量子位 4小时前 103 阅读
4.8 (1280 教程评分)
15,328 人已学习

衡宇 发自 WRC

量子位 | 公众号 QbitAI

一票难求的世界机器人大会现场,一家具身智能小卖部正在不间断面向现场观众接单营业。

工作人员站在一边,在店铺里忙碌的全都是人形机器人

它们是真的在这个智慧小卖部当起了导购员——

顾客对着平板挑选商品后扫码下单,人形机器人店员会根据你的订单,转身移步到货架前,稳稳抓取商品,再转身返回,把商品送到你手中,现场完成结账。

更有一位观众现场下单了2件不同的商品,Galbot都能用双手同时各夹取1件商品,准确、平稳地把商品交给观众。这意味着银河通用的技术在不断迭代。

△Galbot用双手为观众夹取商品,视频来源:银河通用

Galbot既不是按照写死的程序打工,也没有人在背后遥控操纵,它的背后是一整套银河通用自研的端到端具身智能大模型在运作

大会期间,银河通用与英伟达联合首发搭载NVIDIA Jetson Thor芯片的机器人应用。作为国内首款搭载NVIDIA Jetson Thor芯片的机器人,Galbot G1 Premium完成了工业场景的应用。

现场演示中,配备该芯片的机器人展现出丝滑的运动性能以及实时的货箱视觉处理与运动规划能力,速度显著提升,现场观众一致评价为“干活最麻利的人形机器人”。

在Galbot打工的不远处,总有小朋友和搭载银河通用模型的四足机器狗紧密贴贴,疯狂互动。

在这惊人的跟随能力背后,是银河通用自主研发的全球首款端到端导航大模型。该模型基于纯视觉感知,自主推理,具备长程记忆,能够在密集人群、陌生场景中紧密跟随主人,并能自主避障、敏捷穿过狭窄地形。

此外,银河通用WRC展台还首次公开展示其自主训练的人形舞蹈技能

传统机器人舞蹈编排耗时耗力,控制方面的迁移也需要长时间打磨。

银河通用双足人形团队首秀就批量化秀舞,从选舞编排,到强化学习训练,再到Sim2Real迁移、端侧部署,只用仅十天就见证了各种高难度舞蹈动作的诞生。

在大会上岗的前一天,它已经作为机器人零售系统“银河太空舱”的一部份,在北京海淀首发上线,在真实商业场景中投入运营

全球首个城市级、常态化运营的人形机器人示范区正式落地北京,Galbot一年四季风雨无阻的便利店员之路,就这么从北京开始辐射全国了。

一间9㎡的未来便利店

银河太空舱,首发坐落于北京海淀区大融城广场,是一个具身智能终端

其外观选用了银、白、蓝配色,兼具科技感与城市美学,成为一座城市里容易识别的视觉符号:

首发落地后短短的两天多时间里,无论何时路过,都有路人被这所充满科技感的太空舱所吸引。有的持续驻足,更多人则选择亲自扫码体验。

每台太空舱最小仅需9㎡空间,可全天候自主运营。

区别于传统大卖场或自动售卖机只推几种SKU(Stock Keeping Unit,库存量单位),太空舱能根据需求灵活调整陈列货品,支持的商品结构远超传统大卖场和自动贩卖机。

饮品、小食、文创、药品等高频消费品类都可以放在里面售卖,还兼容冷藏/冷冻等多种商品形态。

银河通用为每台太空舱都配备了店员,全部都是银河通用自研的人形机器人Galbot。

无需遥控操作,Galbot可全流程自主完成购买接待、点单支付、商品拿取、当面交付、多语音交互引客,还支持区域特色服务定制。

北京大学助理教授,银河通用机器人创始人及CTO、智源学者王鹤介绍,每一台太空舱都“是全球唯一面向消费者常态化经营的具身智能零售解决方案”

何谓常态化?

这就不得不提到银河太空舱的另一个好处。因为最小仅需9㎡空间就可陈列超300种不同品类商品,所以它可以灵活适配街区、商圈、景区、交通枢纽等不同场景。

更重要的是,这套解决方案不仅支持太空舱单独建设,还能对传统店进行改造,预估最快可在15天内交付

它既服务市民、卖货,又可成为地标、成为流量点,还能临时支援大型活动或夜市打卡,真正成为可移动、可快速部署的城市服务机。

据统计,银河太空舱单舱预计日均服务人次可达2000、订单量达500单,周边人流预估提升30%-40%,有效激活区域活力。

银河通用表示,未来,银河太空舱将结合不同区域特色持续探索更多“机器人+商品”的组合创新,定制提供文创产品、地方特产等多样化商品和服务,进一步增强公共空间的互动性与便利性,真正走入普通人的生活日常。

没有遥控,没有预设,靠端到端具身大模型搞定一切

世界机器人大会现场,上岗便利店员的Galbot自从亮相,就被逛展的朋友们疯狂“军训”。

好奇的观众下单了袋装薯片。

软包装易变形,还挂在货架的钩子上,对机器人来说难度不小。

但Galbot用精准抓取动作稳稳抓起,放到取货区,一气呵成。不仅是软包装商品,一些透明包装商品、易滑易碎商品,都被Galbot精准识别、抓取,最长耗时不过30秒。

实在有点忙不过来时,Galbot已经能够双手出击,左右手同时抓取货架上的商品。

面对随意被踹走、挪动的料箱,Galbot无惧干扰,一手漂移技惊四座:

这些看似简单的操作背后是业内领先的GraspVLA与GroceryVLA等银河通用自研的端到端具身大模型支撑。

GraspVLA是全球首个端到端具身抓取基础大模型,专注于机器人「视觉-语言-动作」(VLA)的多模态协同学习。

它具备强大的zero-shot泛化能力与few-shot适应能力,在多光照、杂乱背景测试中表现优于传统模型。

GroceryVLA则专注零售场景,优化在紧密货架上跨形态抓取能力,无需补采地图或重新调参,可适应新布局。

这种泛化适应,在真实运营时完全不失稳。

GroceryVLA技术还支持闭环控制,即使在抓取中被扰动,也能实时调整至稳定状态。简言之,它不仅“看了就会抓”,还能“边抓边修正”。

首发仪式上,王鹤语气平稳又笃定地对GroceryVLA做了着重介绍。

他表示,GroceryVLA突破传统“视觉+轨迹规划”分离设计,能够在几乎无空隙、货架紧密且SKU众多的真实场景中自主识别商品并稳定抓取,无需路径规划即可灵活高效操作,标志着端到端大模型驱动的闭环控制已具备商用能力。

GroceryVLA还具有以下五大优势:

  • 强适用性
  • 高度通用性
  • 跨场景泛化能力
  • 自主决策能力
  • 强抗干扰性

GroceryVLA不仅全程无遥操、无需场景数据预采集,还支持软硬包装、透明包装、异形包装等多种形态商品的精准抓取,无需单独调参,实现跨品类统一抓取策略,展示了搭载模型的强大泛化能力。

本次世界机器人大会之前,在服贸会、中关村论坛、WAIC等场合,Galbot已经多次现场真实交付。

从北京出发,用具身技术带来真正的生产力

值得一提的是,随着银河太空舱在北京街头的全球首发,“十城百店”合作伙伴计划也正式启动。

“十城百店”计划,即以北京海淀为起点,未来将逐步覆盖更多城市的街区、景区、商圈、交通枢纽等典型场景,构建一个可快速部署、可持续运营的城市级智能商用服务体系。

“十城百店”只是一个阶段性目标,据介绍,银河太空舱的征途是“百城万店”。

这背后,是银河通用想要推动的一种新型城市零售网络——

每个太空舱都是节点,节点越多,网络越密,用户就越可能在日常生活的5分钟半径内接触到具身智能的服务。

2025年,国务院发布《“人工智能+”行动意见》和《关于进一步培育新增长点的措施》,明确提出要围绕消费、零售、文旅等重点场景,加快构建可落地、可推广的新型服务体系,推动人工智能规模化、商业化应用。

作为定位建设具有全球影响力的人工智能创新策源地,北京积极响应号召,在全市范围内推动“AI+”与城市治理、便民服务、场景消费的深度融合。

银河通用正是这一场“战役”的主动参与者

此次发布的银河太空舱,不仅是真实商业场景下常态化运行的智能零售终端,也是一项具备可复制能力的城市服务单元。

王鹤在现场致辞中感叹道:

当Galbot在太空舱中递出第一杯“海淀创新咖啡”时,我们交付的不仅是一台人形机器人,更是海淀区作为全球AI首善之区的科技自信、是我们通过具身智能技术带来真正的生产力。

生产力,是理解太空舱价值的关键——它不仅替代人力,降低成本,更创造新的消费形态和岗位:

  • 新型城市公共服务点
  • 活动现场、交通枢纽、夜市临时部署都可用;
  • 新型流量引力场
  • 话题性强,能带动周边商业;
  • 新型就业岗位催化器
  • 后台需运营、补货、维护、数据分析等人机协作岗位。

北京作为AI技术策源地,有研发、政策、市场多重优势,首发太空舱既是北京市在AI+行动中的一次生动落地,是城市层面落地,也向全国示范“小舱大用”的路径可行可复制。

随着时间推移,落地舱体增加,太空舱节点多了,背后的模型也进化了。

场景融合更多数据、运营效率更高、反馈更快,让模型变得越跑越聪明,形成可持续的基础设施网络和商业循环

可以说,北京首发的银河太空舱,以及世界机器人大会上亮相的Galbot,都只是银河通用向外展示部分阶段性落地能力的一个窗口。

从北京出发,向全国铺开;从一台机器人,到千台太空舱。

当银河太空舱像公交站一样遍布街区,随处可见,AI就不再是远方技术,而是真正融入了日常生活;具身智能也变得触手可及,成为支撑城市运行的新型公共服务与城市基础设施。

放眼望去,这才是银河通用乃至整个具身智能真正的星辰大海。

— 完 —

量子位 QbitAI · 头条

关注我们,第一时间获知前沿科技动态号

教程评分

4.8 (1280 教程评分)

评论 (0)

睡觉动画