AI热点 7 months ago • 326 Views • 0 Comments

小鹏机器人太像人被网友「打假」，何小鹏回应了：感谢认可

AI中国

AI中国

Published 11569 Articles

马斯克还没有赌成功的局，何小鹏刚刚说他做到了——

小鹏自研多模态大模型，迸发智能涌现，从量产智能辅助驾驶开始，统一Robotaxi、具身智能、飞行汽车底层架构，升维到通用物理AI层面：

物理AI的“涌现”，不仅体现在小鹏人形机器人从去年蹒跚学步到今年迈着T台猫步登场：

太过逼真而引来网友纷纷“打假”，小鹏只好一镜到底证明真的不是cosplay：

何小鹏的回应更有意思：

回到造车本行，小鹏这次最直接的进展就是量产车系统超越“辅助”范围，开始成规模成批次克服各种Corner case：

以及在Robotaxi和量产车拉通底层软硬件架构，扫清落地的范围、规模限制：

换句话说，普通用户买到的L4级体验量产车，小鹏率先实现。

所谓“物理AI”，和之前智能驾驶模型最直观的不同，是终端AI直接操控的维度，从简单前后左右二维，变成了飞行汽车的XYZ三维，甚至是机器人数十个不同的运动关节……

从车到复杂AI场景智能涌现的基础，何小鹏自述是从重构车端VLA架构开始。

小鹏重构VLA

从体验上看，小鹏第二代VLA最直观的进步，是打通智能辅助驾驶覆盖的“最后一公里”。

包括郊区、城乡结合部、胡同等等，平均接管里程提高了13倍。

小路、不规则路段做好了，何小鹏认为本质上代表城市NOA能力提高了10倍，高速辅助驾驶能力安全提高了100倍，这就是一个巨大的跳跃。

第二代VLA第二个特点，是几乎能和老司机一样理解、处理路上的各种场景，既包括面对教官检查时的自主“挥手停车”，也包括等待红绿灯起步时自然而然的蠕行。

甚至左右两边各3公分极限窄路通行，现在VLA都能自主完成：

这些高度拟人化的操作，何小鹏说团队根本没有针对性写代码开发，全都是系统在训练过程中自主涌现的能力。

如果说端到端普及，让智能辅助驾驶摆脱“开城”限制，VLA的迭代则让车载AI一定程度摆脱数据分布的限制，不同国家和地区的道路，都能实现最基本的理解操作。

这个能力之上，小鹏开发了Super LCC加人机共驾，导航可开可不开，照样在直路上丝滑的自动辅助驾驶，满足中国跟全球各地的法律法规。

小鹏最新VLA展现出的理解认知能力，与现在市面上常见的VLA不同，并非直接来自大语言模型，而是进行了彻底重构。

从第一性原理出发，小鹏认为现行VLA结构有比较严重的缺陷——通过语言模型理解描述场景耗时长，且信息遗漏比较多。

也就是说小鹏最新的VLA，不再以外挂的超大规模语言模型为核心，而是直接从vision到action，以物理世界模型为核心。

就好比车载AI脑内有个小剧场，基于对物理世界的理解来推演可能的场景，再根据对各个目标的轨迹判断，不断修正自身行车轨迹。

像人一样认知、学习和观察世界。不用中间的语言翻译，直接转为运动的轨迹，首先是可以大幅度降低信息的损耗，因为系统直接看到完整世界。第二，推理效率更高，毕竟现在没有了语言模型的中间转译。

至于语言模型，如今的作用其实是智驾可视化，让用户明白车在做什么，提升信任感。

第二代VLA基座模型的训练，用了接近1亿个视频的Clips，不是标准数据而是各种 corner case，“相当于一个普通人驾驶65000年遇到极限场景的之和。

物理世界模型，内部其实是不断重构改变摄像头原始数据，通过生成新的场景来寻找决策依据。

为了实现这个能力，小鹏使用了阿里云超3万张卡的云端的超大算力集群，以及720亿参数的基础大模型。明年的需求可能会去到5~10万张卡。

何小鹏自述，2024年开始内部有两个VLA团队并行，一个就是现在的量产上车的版本，另一个则是尝试世界模型路线——即刘先明带领的团队。

“月烧一亿”，且长时间没有突破，内部一度想砍掉这个方向，但直到今年2季度某一天，智能“突然”就涌现了。

后面的故事是，刘先明的Title从年初的基座模型负责人，变成了如今的自动驾驶中心组织负责人。

另一个角度看，随小鹏新P7首发量产的VLA系统，半年不到就成了被颠覆替代的版本。

不过用户不必有丝毫被背刺的担心，底层硬件架构通用，最新的第二代VLA年底早鸟测试，预计明年一季度大规模OTA，其实也就最近几个月的事了。

普通人也能买Robotaxi？

技术角度，小鹏承诺完全没问题，所见即所得。

2026年开始，小鹏新车的智能化SKU，除了Max、Ultra，还会加推Robo版，算力、传感器、软件版本完全和小鹏即将量产落地的Robotaxi一样：

当然，回归到普通用户层面，买一辆无人车帮你拉活赚钱，技术上也许正在突破，但法规仍然模糊，并没有放行。

小鹏在做的和特斯拉一样，用大模型自动驾驶技术体系去模糊、拆除L4与L2的壁垒，用体验去说服用户、监管自动驾驶的可靠安全性。

比如，小鹏即将落地的Robotaxi算法架构同样源于最新VLA体系，只不过为了满足L4全无人、万无一失的要求，能力倍增：

四颗图灵芯片，3000TOPS算力，其中有三颗2250TOPS提供运算力，有一颗750TOPS提供算力冗余和安全增强。

同是第二代VLA，Robotaxi上小鹏会训练一种不同风格的自动驾驶，注重极致安全，注重全程零接管的体验。

2026年内预计投入3款Robotaxi车型，全部是小鹏量产车同源，并且和高德地图合作，一同提供Robotaxi服务。用一年时间走完传统L4玩家近10年走过的路。

小鹏最新机器人，能干导购了

物理形态、AI大脑、商业场景三个层面，小鹏最新的人形机器人IRON跟去年比有了脱胎换骨的变化。

首先是物理形态，姿态更丝滑流畅的猫步，背后是小鹏机器人团队重构了整个“骨架”：

仿人的脊椎，可以像人类一样弯腰、双手触地，机器人的站、坐、蹲、躺、爬、摔倒都可以自主完成。

然后是单手高达22个关节自由度的灵巧手，关节直径只有16毫米。此外还有柔软触感的仿生皮肤，内置一系列触觉传感器，交互过程中可以检测触觉信息作为决策依据，同时还能给用户触觉方面的反馈。

其次是仿生的肌肉，让机器人和人类一样有不同的体型，可以根据用途定制：

机器人的头部，集成了一块3D曲面显示，背后有摄像头、毫米波雷达、惯导、鱼眼相机等等，具备了听说、看表情等系列的能力，也可以通过显示屏做出各种表情跟人类互动。

AI大脑层面，IRON置3个大模型，包括VLT、VLA、VLM，使用三颗图灵AI芯片共2250TOPS支撑。

都和量产车、Robotaxi同源同架构。其中VLA负责机器人的运动（和车载VLA同一个团队），VLM负责跟人类的交互，VLT则是机器人自主行动、完成任务的核心引擎。

相当于机器人的“慢大脑”，通过思考决策和任务分解，它会判断在真实的物理环境下，下一步该怎么做。

包括身体怎么动，手怎么动，嘴怎么说、动作该怎么执行……把一个目标拆分成一系列流程，再组合成一系列动作、语言指令。

不过何小鹏认为，现阶段具身智能还没走到大规模落地的泛化阶段，核心原因是机器人与智能汽车不同，现阶段数据来源实在太有限了。

就比如VLA在车上，只需要考虑前后左右双维度运动场景，但IRON有82个关节需要协调，不同场景任务中又有不同需求……

小鹏目前已经建立了具身智能的数据工厂，具体怎么收集生产具身智能数据，何小鹏表示还要保密一段时间。

不过就目前阶段，小鹏人形机器人在一些场景中已经能产生商业价值——导览、导购跟导询，比如购物中心的前台信息咨询、顾客引导，公司的保安巡逻等等。

比如，宝钢集团是首个宣布成为小鹏机器人IRON项目的生态合作伙伴的企业，将探索巡检等复杂的工业领域应用场景。

2026年底，小鹏人形机器人就能实现量产。

实际上第一代机器人已经走进小鹏4S店，作为导购服务进店买车试车的用户。

小鹏飞行汽车：已卖出7000辆，高管先试先飞

全球订出7000辆的是已经量产就绪的陆地航母：

还亮相了一款全倾转混电飞行汽车“A868”：

“陆地航母”是满足个人低空飞行体验，而“A868”实现多人长航程高效出行。

飞行器本身就是鲲鹏超级增程系统，续航500km+，最高航速360km+/h，可最多支持6人乘坐，目前飞行器已经进入试飞阶段。

陆地航母首创了六轴六桨双涵道安全构型，即便对桨失效，仍能安全飞行且着陆，舱内仅1块屏幕、1个操作杆，单手可飞，颠覆了传统飞行汽车操作逻辑，并配有副驾操作台，确保飞行安全。

值得一提的是，小鹏汇天执行“高管先飞计划”，管理团队亲身验证飞行安全，量产交付前，必须飞行超5000公里——其中当然包括何小鹏本人。

飞行汽车的商用落地场景，小鹏其实已经有了初步明确。

比如小鹏已经和旅游胜地敦煌当地达成协议，建立至少5个飞行营地，承担空中游览观光任务。

个人用户层面，小鹏在筹建全球首家飞行汽车6S店，集展示、销售、交付、培训、服务为一体，买小鹏飞行器的同时，“飞行驾校”一对一专班也安排上。

小鹏的物理AI进展，如何评价？

智能汽车狭义层面，小鹏展现出的思考和行动，和其他玩家并不相同。

VLA上车，绝大部分玩家都是采用已有开源的大语言模型做基础（比如最常用的通义千问），采用外挂模式作为端到端系统的参考。

VLA本从大语言模型启发而来，采用“外挂”方式应用到车端一方面是惯性使然，一方面也是量产上车作为目标驱动的结果。

小鹏当然也这么干了，但同时也没放弃第一性原理思考，更加大胆得去花真金白银验证。

也许从小鹏开始，国内自动驾驶驾驶的大模型路线，会彻底和语言模型分流，趋向完全不一样的结构、范式。

这个新范式，就是以世界模型为核心的大模型，从车延伸到其他物理场景的通用AI大脑。

如果小鹏能统一融合L4、L2架构，证明泛化性和安全性可以并存，Robotaxi“地理围栏”范围就有希望逐渐扩大到普通乘用车一样的程度，升维降维之争也会彻底终结。

更进一步，通用AI司机的基座大模型，启发的不只是自动驾驶…

2025年主流汽车工业终于开始力争转型，希望摆脱传统制造业的标签，向智能汽车靠拢；

而在这个赛道第一梯队的小鹏汽车，似乎已经无法用“智能汽车”的标准维度来衡量了。

本文来自微信公众号 “智能车参考”（ID：AI4Auto），作者：贾浩楠，36氪经授权发布。

AI中国

AI中国

11569 Articles 2144100 Views 950300 Fans

Comment (0)

Chapter

1. GPT-4简介与注册指南

1.1 账号注册步骤

Recommended Articles

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

7 months ago • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

7 months ago • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

7 months ago • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0 seconds ago • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

7 months ago • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

7 months ago • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

7 months ago • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

7 months ago • AI热点

Popular Tags

技术选型 Llama模型发现《蜜桃物语》游戏玩法头戴显示器超级人工智能高中英语产学研融合外网推特X 荒诞科技风格

Popular Authors

AI中国

AI中国

11569 Articles 95.03万 Followers

钛媒体APP

钛媒体APP

1489 Articles 0 Followers

IT之家

IT之家

1221 Articles 5.64K Followers

人人都是产品经理

人人都是产品经理

1210 Articles 5.87万 Followers

AIbase基地

AIbase基地

1093 Articles 9.63万 Followers