2025年3月18日,英伟达年度技术大会(GTC)在美国圣何塞开幕,CEO黄仁勋以"AI推理时代"为核心,发布了重磅技术与合作计划,涵盖硬件架构、软件生态、量子计算、机器人技术及行业应用。与往年不同,2025 GTC英伟达转变重心,从去年的"AI训练"转向"推理与部署"的行业转型。其中特别值得关注的是主会议外的1200多场行业应用"AI小会"。研究团队尝试梳理这千场会议内容,以揭示AI行业应用发展趋势,把握推理时代下的AI+行业应用的核心技术与实践重点。内容分为上下两篇:工程技术方向与行业应用实践,本文为上篇,关于AI+行业的若干技术方向。
世界模型和具身AI正在推动物理AI系统与实体世界的深度交互。这种趋势不仅限于自动驾驶领域,还扩展到机器人技术、医疗设备和工业自动化。英伟达的Cosmos平台等世界基础模型平台,正在为物理AI提供了世界基础模型,使机器能够更好地理解和操作物理环境。这些模型能够从视频数据中学习,预测物理交互,并在复杂环境中做出决策。
与传统AI系统不同,端到端世界模型融合了感知、决策和行动,创造出能在现实世界中执行任务的智能体。例如,汽车行业中传统自动驾驶技术,往往是多网合一,通过生成式AI与规则式AI嵌套的方式实现,业内普遍认为最后要实现L4级别以上的自动驾驶,需要用到VLA(Vision-Language-Action),VLA模型集成了视觉、语言理解与行动决策,通过明确的思维链推理过程提高了自动驾驶系统的透明度和可解释性。本次大会中,理想汽车、元戎启行以及小米汽车等厂家均分享了VLA方面的实践,其中理想汽车的MindVLA已官宣将于下半年上车。
二、生成式AI与传统AI工作流程融合深化
企业正在将生成式AI与现有AI系统和业务流程无缝集成,这种融合不仅仅是简单添加大语言模型接口,而是重新设计工作流程,使生成式AI能够增强但非取代现有系统。金融与医疗是两大热门行业。其中,金融服务公司已广泛将传统风险评估模型与LLM大语言模型结合,实现更全面的风险分析,实践案例包括有UBS瑞银集团的投资洞察与实时风险评估、Mastercard信用卡的风险分析以及Visa的支付和网络安全应用等;同样,医疗机构正广泛将诊断系统与生成式医学报告系统集成,提高医疗决策效率,如Telix核药公司的放射性药物决策支持平台、GSK生物医药公司生物成像分析以及各大医院已纷纷试点医学影像AI辅助等,均展示了将生成式AI技术与现有的传统AI工作流和系统整合的实践与探索。当前的应用推进关键在于强调AI作为增强工具而非替代品的角色,专注于人机协作而非全自动化,确保在创新与合规、安全之间取得平衡。
三、推理新范式下的行业专用基础模型崛起
行业专用基础模型正在各个领域蓬勃发展,这些模型针对特定行业数据和任务进行训练和优化。与通用基础模型相比,它们在领域特定任务上表现更佳,同时减少了数据泄露风险。例如,医疗健康领域的专用基础模型能更准确地解读医学术语和临床数据;工业行业的基础模型能更好地理解工业流程与调用专用工具。
与去年相比,当前行业专用基础模型的发展呈现出两大趋势。一方面是模型的可用性提升。在过往“预训练”阶段,行业专用模型的训练与应用存在着高成本、可用性低等问题;而在当下“后训练”与“推理”新范式下,行业专用基础模型的生成方式产生了本质的区别,通过强化学习等方法,少量标注数据实现跨越可用性门槛的行业模型成为可能。另一方面是模型架构的多样化,不仅限于语言模型,还包括多模态模型、图神经网络和物理信息神经算子等。比如,英伟达针对这些行业专用模型提供BioNeMo (生物学)、MONAI (医学影像)等专用框架进行优化,显著提高了在特定领域的准确性和效率。
四、多智能体系统与协作AI生态空间被打开
多智能体AI系统正在从实验阶段迈向生产环境,这些系统由多个专业化AI智能体组成,各自负责不同任务,协同工作以解决复杂问题。这一趋势的独特之处在于AI架构从单一大型系统向分布式、专业化智能体网络的转变。BlackRock公司的Aladdin Copilot构建了企业级多智能体平台,支持联邦应用开发,在控制和可解释的环境中满足组织需求,系统采用LangGraph等框架编排智能体互动,使复杂任务分解为可管理的步骤。这就像一个由多个AI助手组成的智能团队,每个成员各司其职提供投资建议。比如,当用户问“我的投资组合中航空航天行业占比多少?”系统会启动一系列智能助手:一个负责理解问题,一个去查询数据,一个分析结果,最后由一个助手用通俗语言向用户解释。该系统提倡“无限智能体”理念,由3000多名工程师共同开发新助手,即插即用,且设有多重检查,确保信息准确且不泄露隐私。目前已在在200多家金融机构启用。类似于Manus智能体应用,但行业应用中,数据安全与隐私要求更高。
五、AI在高性能计算与科学发现中广泛应用
AI正在变革传统高性能计算(HPC)和科学研究方法,从纯粹的数值模拟向AI增强模型演进。这一趋势涉及将物理模型与神经网络结合,创建性能更高的"混合物理-AI"模型。例如,气候科学家利用AI加速大气动力学模拟;量子化学研究者使用GPU加速的量子电路模拟器提高分子建模效率;生物信息学家结合传统序列分析与深度学习方法加速蛋白质结构预测。AI正改变了科学探索的基本方法,使研究人员能够处理以前难以解决的复杂问题,特别是此前需要超大规模穷尽所有参数的领域,如分子动力学模拟、全基因组分析等,暴力运算与穷尽,使得当前生成式AI在高阶任务中产生特殊的价值。此外,科学领域也正在构建各自专门的基础模型,科学智能体间的“高带宽”协作,正在推进打破人类跨学科研究的门槛推动跨学科研究。英伟达的Blackwell等超级计算芯片以及cuTensor等软件库正在为这些工作流提供了计算基础。
六、企业级应用的检索增强生成(RAG)的专业化
检索增强生成(RAG)正在从概念验证阶段向企业级应用转变,组织正在构建复杂的RAG系统来整合和利用其内部知识库。这一趋势的显著特点是RAG系统架构的复杂化,包括高级检索技术(如混合检索、重排序、多跳推理)、知识图谱整合和多模态检索能力。其中重点实现四个方面的转变:从单一文本检索向全媒体内容理解转变;从通用模型向高度领域专用的知识增强转变;从简单的检索管道向多阶段评估、验证和优化流程转变;从独立系统向端到端、云到边缘的分布式架构转变。基于此让检索增强变得行业可用,金融服务公司构建RAG系统分析庞大的监管文件;制造业使用RAG系统获取复杂设备的维护知识;医疗机构部署RAG系统整合临床指南和患者数据。英传达开发了包括NeMo Retriever检索器和NIM管道构建,专注于确保检索的精确性、可靠性和合规性。与简单的知识库查询不同,企业级RAG系统正实现深度语义理解和推理,能够处理结构化和非结构化数据的融合查询。
七、生成式AI赋能的数字孪生与仿真焕发新机
八、AI安全性与透明度主流化,成行业应用前提
九、生成式AI正在变革内容创建与个性化体验
十、大规模AI基础设施与“AI工厂”的兴起
AI计算基础设施正在从单一GPU集群向综合AI工厂转变,这些工厂整合了计算、存储、网络和冷却系统,为各种AI工作负载提供可扩展解决方案。尤其是进入到推理范式以及多智能体阶段,分布式算力的需求正在指数级提升。这一趋势驱动了液冷技术、高带宽内存和专用互连网络的创新,以支持日益增长的计算需求。另外,更值得关注的是,AI基础设施不再仅是技术问题,而是涉及国家竞争力和数据主权的战略问题。此次GTC国际主权AI峰会分会场中,汇集了英国、法国、意大利、丹麦、日本、印度、韩国、泰国和巴西的政府和行业领导者,讨论了“各国如何拥抱AI工厂作为数字转型和弹性的关键基础设施。”这一议题。其中,部分国家和大型企业纷纷建立AI主权能力,部署本土AI工厂支持国家和企业生态系统。用途各有侧重:印尼、印度、意大利、韩国等着眼于语言和文化适应的基础模型; 德国侧在铁路自动化这一特定领域,构建先进的模拟基础设施。全球AI基础设施正在从通用平台向专业化、主权化和领域特化方向发展。
发表评论 取消回复