如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!
10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!
阿里云算法专家李也博士已确认出席并发表题为《突破泛化瓶颈:阿里云智能运维 Agent 评测体系实践》的主题分享。大模型 Agent 在智能运维场景落地时常常遇到“做 demo 容易,泛化难”的问题。借鉴编程智能体中可验证环境的成功经验,阿里云构建了智能运维领域的可验证实验环境和高质量评测集。阿里云可观测团队对云原生应用的运行态进行了详尽的理论建模,构建了覆盖 APM/容器/云服务/操作系统/LLM 应用等领域的实验环境,设计了全面的故障注入机制,并在此基础上制作了大规模高质量的评测集。
本次分享李也博士将介绍这个实验环境并发布评测集,深入探讨如何利用评测集验证并提升基于 Agent 的智能运维算法泛化性。

李也,阿里云云原生可观测算法专家,香港中文大学计算机博士,在智能运维和数据驱动的决策方向有近 10 年科研和落地经验。主导的异常检测和根因定位等 AIOps 算法在阿里云大规模落地。在 ASPLOS、SIGMOD、WWW、VLDB、TKDE、TON 等顶会顶刊发表过多篇 AIOps 算法论文,并在这些国际会议上做报告。目前他专注于大模型 Agent 及其强化学习在智能运维场景的落地。他在本次会议的详细演讲内容如下:
演讲提纲
1. 智能运维泛化之痛
传统的基于规则的智能运维难泛化
受限于基础大模型能力限制,基于 Prompt Engineering 和大模型 Workflow 的智能运维在泛化性上也会遇到瓶颈
用大模型 Agent 做 demo 容易,上生产难
2. 智能运维领域的评测集介绍
评测集的规模:数据量级与场景多样性
评测集的覆盖度:跨领域的全面性
3. 如何构建高质量的评测集
在解决智能运维场景泛化性问题之前,我们需要想清楚要泛化到哪些场景
对智能运维 Agent 评测问题的理论建模——把问题边界想清楚
实验环境的架构设计和实现
构建评测集过程中踩过的坑与经验教训
4. 基于评测集的智能运维 Agent 能力提升实践
如何用评测集验证智能运维 Agent 的泛化性及其可信度
阿里云智能运维 Agent 在评测集上的表现
如何用实验环境和评测集提升智能运维 Agent 的泛化性
您认为,这样的技术在实践过程中有哪些痛点?
对系统状态的建模和故障注入的覆盖度有一定的假设
演讲亮点
工程实践:阿里云可观测团队构建 AIOps 评测集的技术实践
方法论创新:把问题想清楚——关于如何构建评测集覆盖尽可能多真实问题的深度思考
实战指南:如何用评测集验证并提升智能运维 Agent 的泛化性
听众收益
了解一个可以用于验证并提升智能运维 Agent 泛化性的高质量评测集
掌握如何用高质量评测集提升 Agent 泛化性的方法
获得构建企业级 AIOps 评测体系的实践经验
除此之外,本次大会还策划了多模态融合技术与创新应用、混沌工程与全链路压测实践、Data Infra for AI、Agentic AI、加速与反哺:AI 时代的可观测实践、Vibe Coding、端侧大模型的创新与应用、大模型推理的工程实践、AI 搜索技术的深水区、模型训练与微调、具身智能:当 AI 学会“动手思考”、大模型驱动的制造革命、AI4SE:软件研发提质增效实践、AI 重塑视觉创作体验、从“炫技”走向“实用”的 AI 产品、大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。
现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。
