AI热点 6小时前 127 浏览次数 0 评论

小鹏机器人太像人被网友「打假」,何小鹏回应了:感谢认可

AI中国
AI中国

发布了 11569 文章

马斯克还没有赌成功的局,何小鹏刚刚说他做到了——

小鹏自研多模态大模型,迸发智能涌现,从量产智能辅助驾驶开始,统一Robotaxi、具身智能、飞行汽车底层架构,升维到通用物理AI层面:

物理AI的“涌现”,不仅体现在小鹏人形机器人从去年蹒跚学步到今年迈着T台猫步登场:

太过逼真而引来网友纷纷“打假”,小鹏只好一镜到底证明真的不是cosplay:

何小鹏的回应更有意思:

回到造车本行,小鹏这次最直接的进展就是量产车系统超越“辅助”范围,开始成规模成批次克服各种Corner case:

以及在Robotaxi和量产车拉通底层软硬件架构,扫清落地的范围、规模限制:

换句话说,普通用户买到的L4级体验量产车,小鹏率先实现。

所谓“物理AI”,和之前智能驾驶模型最直观的不同,是终端AI直接操控的维度,从简单前后左右二维,变成了飞行汽车的XYZ三维,甚至是机器人数十个不同的运动关节……

从车到复杂AI场景智能涌现的基础,何小鹏自述是从重构车端VLA架构开始。

小鹏重构VLA

从体验上看,小鹏第二代VLA最直观的进步,是打通智能辅助驾驶覆盖的“最后一公里”。

包括郊区、城乡结合部、胡同等等,平均接管里程提高了13倍。

小路、不规则路段做好了,何小鹏认为本质上代表城市NOA能力提高了10倍,高速辅助驾驶能力安全提高了100倍,这就是一个巨大的跳跃。

第二代VLA第二个特点,是几乎能和老司机一样理解、处理路上的各种场景,既包括面对教官检查时的自主“挥手停车”,也包括等待红绿灯起步时自然而然的蠕行。

甚至左右两边各3公分极限窄路通行,现在VLA都能自主完成:

这些高度拟人化的操作,何小鹏说团队根本没有针对性写代码开发,全都是系统在训练过程中自主涌现的能力。

如果说端到端普及,让智能辅助驾驶摆脱“开城”限制,VLA的迭代则让车载AI一定程度摆脱数据分布的限制,不同国家和地区的道路,都能实现最基本的理解操作。

这个能力之上,小鹏开发了Super LCC加人机共驾,导航可开可不开,照样在直路上丝滑的自动辅助驾驶,满足中国跟全球各地的法律法规。

小鹏最新VLA展现出的理解认知能力,与现在市面上常见的VLA不同,并非直接来自大语言模型,而是进行了彻底重构。

从第一性原理出发,小鹏认为现行VLA结构有比较严重的缺陷——通过语言模型理解描述场景耗时长,且信息遗漏比较多。

也就是说小鹏最新的VLA,不再以外挂的超大规模语言模型为核心,而是直接从vision到action,以物理世界模型为核心

就好比车载AI脑内有个小剧场,基于对物理世界的理解来推演可能的场景再根据对各个目标的轨迹判断,不断修正自身行车轨迹

像人一样认知、学习和观察世界。不用中间的语言翻译,直接转为运动的轨迹,首先是可以大幅度降低信息的损耗,因为系统直接看到完整世界。第二,推理效率更高,毕竟现在没有了语言模型的中间转译。

至于语言模型,如今的作用其实是智驾可视化,让用户明白车在做什么,提升信任感。

第二代VLA基座模型的训练,用了接近1亿个视频的Clips,不是标准数据而是各种 corner case,“相当于一个普通人驾驶65000年遇到极限场景的之和。

物理世界模型,内部其实是不断重构改变摄像头原始数据,通过生成新的场景来寻找决策依据。

为了实现这个能力,小鹏使用了阿里云超3万张卡的云端的超大算力集群,以及720亿参数的基础大模型。明年的需求可能会去到5~10万张卡。

何小鹏自述,2024年开始内部有两个VLA团队并行,一个就是现在的量产上车的版本,另一个则是尝试世界模型路线——即刘先明带领的团队。

“月烧一亿”,且长时间没有突破,内部一度想砍掉这个方向,但直到今年2季度某一天,智能“突然”就涌现了。

后面的故事是,刘先明的Title从年初的基座模型负责人,变成了如今的自动驾驶中心组织负责人。

另一个角度看,随小鹏新P7首发量产的VLA系统,半年不到就成了被颠覆替代的版本

不过用户不必有丝毫被背刺的担心,底层硬件架构通用,最新的第二代VLA年底早鸟测试,预计明年一季度大规模OTA,其实也就最近几个月的事了。

普通人也能买Robotaxi?

技术角度,小鹏承诺完全没问题,所见即所得。

2026年开始,小鹏新车的智能化SKU,除了Max、Ultra,还会加推Robo版,算力、传感器、软件版本完全和小鹏即将量产落地的Robotaxi一样:

当然,回归到普通用户层面,买一辆无人车帮你拉活赚钱,技术上也许正在突破,但法规仍然模糊,并没有放行。

小鹏在做的和特斯拉一样,用大模型自动驾驶技术体系去模糊、拆除L4与L2的壁垒,用体验去说服用户、监管自动驾驶的可靠安全性。

比如,小鹏即将落地的Robotaxi算法架构同样源于最新VLA体系,只不过为了满足L4全无人、万无一失的要求,能力倍增:

四颗图灵芯片,3000TOPS算力,其中有三颗2250TOPS提供运算力,有一颗750TOPS提供算力冗余和安全增强。

同是第二代VLA,Robotaxi上小鹏会训练一种不同风格的自动驾驶,注重极致安全,注重全程零接管的体验。

2026年内预计投入3款Robotaxi车型,全部是小鹏量产车同源,并且和高德地图合作,一同提供Robotaxi服务。用一年时间走完传统L4玩家近10年走过的路。

小鹏最新机器人,能干导购了

物理形态、AI大脑、商业场景三个层面,小鹏最新的人形机器人IRON跟去年比有了脱胎换骨的变化。

首先是物理形态,姿态更丝滑流畅的猫步,背后是小鹏机器人团队重构了整个“骨架”:

仿人的脊椎,可以像人类一样弯腰、双手触地,机器人的站、坐、蹲、躺、爬、摔倒都可以自主完成。

然后是单手高达22个关节自由度的灵巧手,关节直径只有16毫米。此外还有柔软触感的仿生皮肤,内置一系列触觉传感器,交互过程中可以检测触觉信息作为决策依据,同时还能给用户触觉方面的反馈。

其次是仿生的肌肉,让机器人和人类一样有不同的体型,可以根据用途定制:

机器人的头部,集成了一块3D曲面显示,背后有摄像头、毫米波雷达、惯导、鱼眼相机等等,具备了听说、看表情等系列的能力,也可以通过显示屏做出各种表情跟人类互动。

AI大脑层面,IRON置3个大模型,包括VLT、VLA、VLM,使用三颗图灵AI芯片共2250TOPS支撑。

都和量产车、Robotaxi同源同架构。其中VLA负责机器人的运动(和车载VLA同一个团队),VLM负责跟人类的交互,VLT则是机器人自主行动、完成任务的核心引擎。

相当于机器人的“慢大脑”,通过思考决策和任务分解,它会判断在真实的物理环境下,下一步该怎么做。

包括身体怎么动,手怎么动,嘴怎么说、动作该怎么执行……把一个目标拆分成一系列流程,再组合成一系列动作、语言指令。

不过何小鹏认为,现阶段具身智能还没走到大规模落地的泛化阶段,核心原因是机器人与智能汽车不同,现阶段数据来源实在太有限了。

就比如VLA在车上,只需要考虑前后左右双维度运动场景,但IRON有82个关节需要协调,不同场景任务中又有不同需求……

小鹏目前已经建立了具身智能的数据工厂,具体怎么收集生产具身智能数据,何小鹏表示还要保密一段时间。

不过就目前阶段,小鹏人形机器人在一些场景中已经能产生商业价值——导览、导购跟导询,比如购物中心的前台信息咨询、顾客引导,公司的保安巡逻等等。

比如,宝钢集团是首个宣布成为小鹏机器人IRON项目的生态合作伙伴的企业,将探索巡检等复杂的工业领域应用场景。

2026年底,小鹏人形机器人就能实现量产。

实际上第一代机器人已经走进小鹏4S店,作为导购服务进店买车试车的用户。

小鹏飞行汽车:已卖出7000辆,高管先试先飞

全球订出7000辆的是已经量产就绪的陆地航母

还亮相了一款全倾转混电飞行汽车“A868”:

“陆地航母”是满足个人低空飞行体验,而“A868”实现多人长航程高效出行。

飞行器本身就是鲲鹏超级增程系统,续航500km+,最高航速360km+/h,可最多支持6人乘坐,目前飞行器已经进入试飞阶段。

陆地航母首创了六轴六桨双涵道安全构型,即便对桨失效,仍能安全飞行且着陆,舱内仅1块屏幕、1个操作杆,单手可飞,颠覆了传统飞行汽车操作逻辑,并配有副驾操作台,确保飞行安全。

值得一提的是,小鹏汇天执行“高管先飞计划”,管理团队亲身验证飞行安全,量产交付前,必须飞行超5000公里——其中当然包括何小鹏本人。

飞行汽车的商用落地场景,小鹏其实已经有了初步明确。

比如小鹏已经和旅游胜地敦煌当地达成协议,建立至少5个飞行营地,承担空中游览观光任务。

个人用户层面,小鹏在筹建全球首家飞行汽车6S店,集展示、销售、交付、培训、服务为一体,买小鹏飞行器的同时,“飞行驾校”一对一专班也安排上。

小鹏的物理AI进展,如何评价?

智能汽车狭义层面,小鹏展现出的思考和行动,和其他玩家并不相同。

VLA上车,绝大部分玩家都是采用已有开源的大语言模型做基础(比如最常用的通义千问),采用外挂模式作为端到端系统的参考。

VLA本从大语言模型启发而来,采用“外挂”方式应用到车端一方面是惯性使然,一方面也是量产上车作为目标驱动的结果。

小鹏当然也这么干了,但同时也没放弃第一性原理思考,更加大胆得去花真金白银验证。

也许从小鹏开始,国内自动驾驶驾驶的大模型路线,会彻底和语言模型分流,趋向完全不一样的结构、范式。

这个新范式,就是以世界模型为核心的大模型,从车延伸到其他物理场景的通用AI大脑。

如果小鹏能统一融合L4、L2架构,证明泛化性和安全性可以并存,Robotaxi“地理围栏”范围就有希望逐渐扩大到普通乘用车一样的程度,升维降维之争也会彻底终结。

更进一步,通用AI司机的基座大模型,启发的不只是自动驾驶…

2025年主流汽车工业终于开始力争转型,希望摆脱传统制造业的标签,向智能汽车靠拢;

而在这个赛道第一梯队的小鹏汽车,似乎已经无法用“智能汽车”的标准维度来衡量了。

本文来自微信公众号 “智能车参考”(ID:AI4Auto),作者:贾浩楠,36氪经授权发布。

AI中国

AI中国

11569 文章 2144100 浏览次数 950300 粉丝

评论 (0)

睡觉动画