
智东西
作者 | ZeR0
编辑 | 漠影
国产AI芯片正处于重要的历史机遇窗口。
今年的模型创新仿佛踩上风火轮,开源模型密集发布更新,进一步引爆推理需求增长。AI推理芯片将在接下来的AI产业发展进程中扮演更加重要的角色。
在世界人工智能大会期间,云天励飞公布全面聚焦AI芯片的最新战略,并披露最新AI芯片全产品矩阵及未来三年商用路线图,计划到2028年将单芯片算力最高扩展至数千TOPS。
凭借创新的“算力积木”架构,云天励飞AI芯片能实现7B、14B、130B、671B等不同参数量大模型的高效推理,适配DeepSeek-R1系列模型、阿里QwQ-32B模型及国产鸿蒙操作系统。云天励飞CTO李爱军告诉智东西,包括DeepSeek、Qwen模型在内,云天励飞AI芯片与主流开源模型均已完成适配。
特别的是,云天励飞打造的是“纯血版国产工艺AI芯片”,而且实现端边云“三栖”落地,应用场景小到嵌入式硬件,中到边缘计算与具身智能,大到万亿参数大模型。

在具身智能领域,云天励飞已与十余家机器人厂商建立合作关系,边缘芯片产品应用于服务型机器人已进入实际部署阶段。该公司还作为创始股东之一,参与投资了深圳国创具身智能机器人有限公司,探索AI推理芯片在具身智能等未来前沿方向的应用和落地。
值此时机,云天励飞为何全面聚焦AI芯片?又如何在日趋激烈的AI芯片竞赛突出重围?云天励飞董事长兼CEO陈宁博士、云天励飞CTO李爱军与智东西进行了深入交流。
一、风起大模型,解读AI推理风向与历史性机遇
云天励飞董事长兼CEO陈宁博士谈道,2030年是全球公认的AGI(通用人工智能)可能实现重大突破的一个转折时间点。
2025年上半年,AI应用落地提速,Agent成本的降低将带来应用普惠,随着AI应用无处不在,全球AI将从训练时代进入以应用驱动为核心的推理时代。
过去十多年,AI领域经历了以训练为核心的GPU时代——通过训练大规模模型获取基础能力,类似于电力时代的“发电”,注重大规模生产算力。
而AI推理芯片的关键在于“用电”,即在终端及云边端以低成本、高效率完成推理运算,更关注成本效率及规模化应用,不像训练芯片那样依赖CUDA。
在此背景下,AI推理芯片的重要性逐渐上升,成为推动AI技术应用落地及与商业化的核心驱动力。
陈宁认为,AI推理芯片不仅在推理效率、能效方面具有重大优势,它们还将作为智能硬件、机器人、智能设备等终端产品的“引擎”,成为AI产业大规模应用的核心基础。
AI推理芯片是中国抢占第四次工业革命的一张关键入场券。随着2030年AGI(通用人工智能)突破的潜在临近,AI推理芯片能否实现成本、性能和生态的突破,决定了中国能否在新一轮技术浪潮中占据主动。
未来五年,从可穿戴设备、AI原生硬件、智能终端到算力设备,AI将重塑所有电子设备,推理算力网络将无处不在,推动推理芯片市场迎来爆发。
在国外先进算力几乎完全禁售的背景下,这将带给国产全自主可控AI推理算力巨大市场机会。
经过10年积累,云天励飞在AI推理芯片技术研发和市场应用上的布局逐渐成熟,选择在2025年全面聚焦AI推理芯片,抓住这一历史性机遇。
二、围绕AI芯片沉淀四大业务板块,端边云支撑高性价比大模型推理
到2028年,云天励飞计划研发三代“算力积木”架构,布局三大商用计算平台(深界、深擎、深穹),算力最高可扩展至数千TOPS。下一代芯片将基于第二代“算力积木”架构,通过新型计算、近存计算、NB-Mesh新型互连、新型封装、NB-Link通用扩展性五大创新,打造新型大模型推理平台。
· 深穹:大模型推理一体机
· 深界:边缘网关、边缘盒子
· 深擎:机器人/无人机/无人车
基于国产工艺及自研“算力积木”架构,其深界DeepEdge10平台已适配DeepSeek、QwQ-32B模型及鸿蒙操作系统。
云天励飞的整体产品布局围绕自研AI推理芯片展开,沉淀出4大业务板块,布局端边云,联合生态合作伙伴推出覆盖从模组、边缘推理盒子、AI推理加速卡、大模型推理一体机、智算服务器等产品。

其产品已广泛应用于智算中心、智慧城市、具身智能机器人等领域。
2024年6月,云天励飞签署《AI算力运营合作框架协议》,拿到16亿元的算力服务大单,提供总算力规模约4000PFLOPS的AI训练及推理异构算力服务。
面向具身智能和机器人领域,云天励飞战略投资闪极科技、智慧互通、臻识科技、神州云海、国创具身机器人等,为AI推理芯片的应用开辟了更多元化的场景。
未来云天励飞AI推理芯片计划重点面向三大市场:边缘计算、云端大模型推理、智能机器。
在市场拓展方面,云天励飞获得16亿元算力服务大单,显示了其产品在部分关键领域的商业认可度。
三、靠芯片拿到创业“第一桶金”,云天励飞做AI芯片的基因与优势
身为一家AI公司,云天励飞为什么要自研AI推理芯片?答案是通过深入匹配特定应用场景,自研AI芯片一旦形成规模化,就能带来更好的成本效益。
据陈宁分享,云天励飞核心创始团队具备深厚的NPU芯片设计经验,最早从2009年开始参与神经网络处理器相关设计。
该公司的第一笔融资,也来源于芯片。
2014年,云天励飞刚成立时,初心是通过NPU降低AI计算成本,当时还用NPU课题申报了政府的人才引进项目,还拿下第一,得到研发资金支持。
可以说,芯片,正是云天励飞初期获得投资的关键。
云天励飞在2015年启动第一代深度学习处理器的研发,2018年-2019年第二代AI芯片DeepEye1000流片成功,并且在之后几年中,云天励飞AI芯片相继并下国家发改委、科技部、工信部重大专项的“大满贯”,结合自身技术积累及市场需求,逐步发展成集芯片设计、软硬件集成和应用落地于一体的企业。
2020年5月,因被列入美国实体清单,云天励飞不得做出战略调整,坚定转向国产工艺路线。
面对国产工艺尚不成熟的挑战,它首创“算力积木”架构,并敲定国产先进工艺的合作,成为首家采用国产Chiplet工艺的AI芯片,自此踏上用国产工艺设计商用AI芯片的新阶段。“算力积木”架构通过模块化设计解决单芯片面积与良率的矛盾,以实现算力的可扩展性和商业化应用。
自2020年决定转向国产工艺后,云天励飞不仅克服了当时国产工艺的不成熟问题,还通过技术创新实现了算力积木架构的突破。通过自主研发的算力架构和互连技术,云天励飞在推理芯片领域取得了显著的技术进展,并将其成功转化为实际的产品。
此后两年多时间,云天励飞斩获第十届吴文俊人工智能专项奖芯片项目一等奖,发布大模型边缘推理一体芯片深界DeepEdge10,全面入局大模型推理。
这两年来,云天励飞相继推出AI推理芯片深界DeepEdge200、大模型推理加速卡深穹6000及深穹X6000 Mesh加速卡,其DeepSeek一体机解决方案在深圳龙岗、南山、湛江等城市落地。
结合算力架构演进趋势,云天励飞在过去10年研发了5代NPU,技术路径贯穿从小规模CNN算法到面向大规模预训练模型的异构计算需求。这些在智能硬件、智算中心、智慧城市等领域积累的know-how和经验,为其芯片设计和持续迭代提供了明确指导,形成了算法-芯片-应用的“数据飞轮”闭环,推动AI和芯片技术持续迭代。

“算法芯片化”一直是云天励飞的核心技术策略,将不断进化的AI算法映射至芯片架构,确保算法与硬件高度契合。基于技术与应用双轮驱动,云天励飞旨在提升AI推理芯片在性能、成本、功耗及生态兼容等方面的综合竞争力,坚持“算法芯片化”技术策略。
通过与生态伙伴紧密合作,云天励飞进一步加强了产品的市场适配,尤其是在具身智能和边缘计算领域,确保其AI推理芯片能够在不同应用环境中发挥最佳性能。
结语:AI推理芯片未来,看中国
AI芯片是智能硬件和算力网络的核心,AI推理芯片的需求已进入加速期,国产AI芯片正面临前所未有的机遇。而中国作为全球AI产业重要一环,必须在这一浪潮中抓住核心技术机遇。
云天励飞通过“算力积木”架构和国产工艺的创新,以及持续的产业积累,提供高效、低成本的AI推理芯片产品,逐步打破技术和工程壁垒,满足大模型推理的广泛需求。
随着AI推理需求的爆发和国产生态的不断完善,AI推理芯片的全球竞争预计将更加激烈。国产AI芯片的发展不仅依赖于技术突破,更需产业链上下游的协同配合。
面对技术突破及生态构建挑战,云天励飞的战略聚焦将不仅限于技术创新,还要通过推动推理芯片标准化,为国产芯片在全球市场的布局铺平道路。