AI热点 14小时前 134 浏览次数 0 评论

卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度

量子位

发布了 301 文章

鹭羽 发自 凹非寺

量子位 | 公众号 QbitAI

太夸张!百度办AI“培训班”,大佬都纷纷要来拜师学艺。

刚刚百度举办了首席AI架构师培养计划 (AICA)的第九期开学典礼,一看吓一跳,本期学员里可谓是卧虎藏龙。

除了有来自茅台、奔驰、麦当劳等明星企业的技术高管,还有国网、中石化、中石油等一众国字号大佬云集于此。

所以让大佬们挤破脑袋都想进来学习的AICA到底是个啥?

依托百度自研的深度学习平台飞桨文心大模型,AICA目标培养复合型AI架构师,简单来说,就是既能参与技术开发,又能确保项目落地。

而今年较之以往最不同的是,从导师到学员,聊得最火热的话题莫过于——大模型

相关课题占比51%,并首次出现多智能体协同等前沿技术应用。

与会嘉宾也在开学典礼上重点强调大模型推动产业变革的意义所在,从底层架构再到软硬件协同发展,以及为AI架构师如何跟上大模型发展速度提出了宝贵意见。

以下是量子位从嘉宾演讲中整理出的部分精彩内容,在不改变原义的基础上进行了适当调整。

大模型正在逐步转向产业落地

安晖:AI技术赋能产业发展

来自中国电子信息产业发展研究院的副总工安晖,首先就整个AI行业发展进行了系统性分析。

他认为,AI将会是继蒸汽机、互联网之后推动整个社会经济发展的重要通用技术,而当前更是进入了加速重视AI应用工具的新阶段。

尤其是从2025世界人工智能大会可以看出,AI竞争正在逐步转向场景落地,如制造、医疗、金融等领域。

以及全网关注的GPT-5也侧面说明,当前底层模型能力已足够强大,大模型性能提升速度或将放缓,现在产业重心应当放在大模型的应用落地

AI技术未来将在企业发展中占据更为重要的作用,根据OpenAI发布的企业客户研究报告,AI可以在提高工作效率、解放员工的重复性任务、推动产品创新三个方面带来显著提升。

赛迪研究院也补充指出,AI还将重构服务模式、实现资源均衡,共同促进多行业变革。

而当前我国AI发展呈现出三大趋势,分别是技术比拼、商业应用、产业格局:

  • 技术比拼:整体参数规模转向智能水平,核心竞争力在于技术护城河。
  • 商业应用:正在从概念验证转向场景实践,逐步建立特色AI生态。
  • 产业格局:整体从分散行动发展成头部企业主导行业风向,把握优势资源成为企业的重中之重。

但安晖也表示,相关产品效益还未完全显现,从人工智能大会也能看出,当前新产品在功能、形态和应用内容上存在同质化,缺乏创新闪光点。

其迈向实际应用过程中,如何与实体企业核心业务挂钩,当前各大AI企业还未给出准确的方案,如何能够让用户认同AI价值、对AI营收效益持积极向好态势,都是进一步推动AI应用必须解决的前提条件。

另外,行业缺乏AI经验和数据支持,从而导致产用脱节、落地困难。

因此,安晖建议应该以创造价值为导向发展AI,帮助企业增收降本,另一方面重视AI人才培养,无论是校企培养,还是AI企业和用户企业协作培养,寄希望于将技术深度融入业务体系。

马艳军:新技术重构AI能力边界

百度AI技术生态总经理马艳军则主要介绍当前大模型技术在产业融合中的能力状态以及AI架构师应当如何应对这种变化。

首先整个大模型技术已经得以完善增强,拥有更好的多任务泛化能力,产品研发流程也变得更加标准化。

LLM已逐步具备专家级智能水平,现在只需要向大模型表达需求,就能立即获得对应任务结果。

例如百度基于文心大模型4.5 Turbo打造的罗永浩数字人技术,可以专业且长时间地保持高质量直播输出,体现出一个多功能LLM的深度思考和分析能力。

此外,LLM为整个行业带来了翻天覆地的变化,尤其是编程领域。

在百度内部,整个AI代码生成的占比和采纳率已经从2022年的5%和15%增长至50%和80%,大模型能够完成复杂编程任务,如删除功能模块或纠正编译错误。

这对团队的首席AI架构师而言,将会是一个巨大的挑战。

要想要跟上LLM发展趋势,将其能力最大化,AI架构师就需要知道如何让模型输出、如何让模型输出更优、如何让模型输出更快。

马艳军表示,需要从以下四个方面入手:

  1. 深入了解提示词工程:相应优化技巧包括合理拆解复杂任务、组织输出顺序、补充合适信息以缓解幻觉、多文档引用正确指令和使用可理解的文本格式。
  2. 学习模型调优方式:包括增加预训练、对指令监督微调、进行奖励模型训练,以及偏好对齐。
  3. 掌握全栈系统设计能力:从模型开发、训练、精调、压缩再到部署推理,可实现完整性标准流程。
  4. 深刻理解场景问题:洞察行业痛点,能够判断什么场景需要什么模型,构建针对性解决方案。

总之,首席AI架构师需要学会将Agent融入日常工作流程,推动产业范式升级。

于佃海:从深度学习到大模型

在本次开学典礼中,百度飞桨总架构师于佃海,也带来了有关深度学习到大模型发展变迁的第一堂课。

随着LLM发展,现在来到了软件3.0时代,1.0时代是传统编码实现功能,2.0时代基于深度学习,通过训练模型实现功能,3.0时代直接一个大模型提示词就能完成多种任务。

大模型的本质不仅仅是参数量大,规模从百万级到现在的十亿级,更重要的是其模型结构学习机制以及推理能力的进步。

当前LLM模型架构主要还是以Transformer为核心,基于神经网络的注意力机制,从序列的转换发展而来。

而未来LLM架构还会继续基于Transformer持续优化,与此同时更加重视专家MoE结构

学习机制上,深度学习在新一代的大模型训练流程中分别承担不同功能角色,自监督学习可以实现大规模预训练,监督学习负责增强LLM指令遵循能力,强化学习通过人类反馈提升模型的偏好对齐。

高效推理部署是当前大模型应用推广的关键,相当考验基础设施建设,目前硬件(芯片、算力、存储)方面还有所落后,软件(分布式训练框架、高效推理引擎、优化工具)方面则已取得进展。

未来还需要实现软硬件协同发展,包括支持更多硬件高效适配接入、构建大规模硬件集群达成多维混合并行、芯片层面深度协同优化,最终搭建起大模型时代的深度学习平台。

AICA:培养真正懂AI、做AI的架构师

从2019年开始,这已经是AICA举办的第九个学期,作为百度与深度学习技术及应用国家工程研究中心的联合发起项目,吸纳了来自各行各业的顶尖人才参与。

本期共招收学员96名,是通过长达半年的预科学习、项目技术评审以及多轮考核,才从500多名报名者中脱颖而出的。

其中,61%的学员来自国央企、上市公司以及行业龙头T1应用服务商,80%有“管理+专业+技术”复合背景,均是各大公司的CTO或技术高管,行业覆盖18个领域,包括能源、重工业、医疗康养、海关物流等,也有像贵州茅台、奔驰这类头部知名企业的加入。

课题内容方面,AICA第九期新增文心开源、MCP前沿技术、多模态、数据等模块,以及百度重点技术的实战案例,当前AI应用的主流技术路线全覆盖。

例如本次麦当劳团队申报的课题《麦麦巡警数字员工》:

麦麦团队希望得到关于大模型优化、任务调度与管理等方面的技术指导和建议,进一步了解场景Agent落地的工程化设计思路,助力提升麦麦巡警数字员工的开发效果。

百度集团副总裁吴甜也在会上表示,AICA将通过文心大模型与飞桨深度学习平台,为学员们提供产业级模型与工具链,另外保障丰富的实践案例以供参考,并提供终身学习与交流平台。

目前AICA已向业界输送489名AI架构师,遍布工业、能源、金融、交通、农业、互联网等数十个行业,真正实现懂AI、做AI,让AI落地真实场景。

参考链接:
[1]https://mp.weixin.qq.com/s/H5ctOM-zBNQaBwXdvkxZyQ

— 完 —

量子位 QbitAI · 头条号

关注我们,第一时间获知前沿科技动态

量子位

量子位

301 文章 43327 浏览次数 9840 粉丝

评论 (0)

睡觉动画