微软开源Web Agent项目:Magentic-UI!

微软开源Web Agent项目:Magentic-UI!

4.8
0热度

当全球开发者还在为Copilot的代码生成能力惊叹时,微软的AI实验室在Build 2025 开发者大会上又甩出一张开源王炸——Magentic-UI!这是继 Magentic-One 后,微软推出的新一代多智能体 Web 操作系统!

它可以:

自动浏览网页、 读取文件、 写代码,还能和你配合完成任务。

但它不是全自动机器人,它是你和 AI 一起工作的小伙伴,你有最终的控制权,它只负责干活。

  • 所有操作都显示给你看,点击按钮、打开页面、发送信息,都会提前征求你同意。
  • 执行任务时,你可以随时暂停、修改计划、重启流程。
  • 你也可以设置哪些操作必须人工批准。

一、主要功能:

  • 浏览网页自动点击、填表
  • 写代码、运行结果返回
  • 看文件内容并回答问题
  • 用户可以制定任务步骤,随时修改、暂停

二、核心亮点

协同规划:任务开始前,Magentic-UI 会生成详细的步骤计划,用户可以根据自己的需求和预期对计划进行调整和确认,保证任务按预期展开。

协作执行:在任务执行过程中,系统会实时显示即将执行的动作,用户可随时接管控制权,确保任务执行符合需求。

安全机制:在执行重要或不可逆的操作前,Magentic-UI 会征询用户同意,支持用户自定义审批规则,保护操作安全。有效避免了因 AI 决策失误而可能带来的损失,让用户在使用过程中更加安心。

学习复用:任务结束后,系统会保存执行方案,用户可以在未来的任务中重复使用或修改这些方案,从而提升工作效率。随着使用次数的增加,Magentic-UI 会越来越了解用户的工作习惯和需求,提供更加个性化和高效的服务。

三、技术创新

  • 神经样式引擎(NSE) 采用类GPT-4的扩散模型,可将自然语言描述(如"科技感深蓝渐变")动态编译为CSS变量,同时保证多浏览器兼容性。
  • 组件DNA图谱 每个组件都有可追踪的版本基因,支持跨项目的智能组件复用。某开源社区测试显示,组件重复开发率降低92%。
  • 实时性能先知 在拖拽布局时,AI会预测页面加载性能,并给出优化建议。早期采用者反馈,首屏加载时间平均减少40%。

当我们在惊叹Magentic-UI的神奇时,微软AI实验室负责人Chris Novak却说:"这仅仅是智能开发工具进化的第一个阶段。" 期待它将在未来的数字化生活和工作中发挥更大的作用,为我们带来更加高效、智能、安全的体验。

GitHub:https://github.com/microsoft/magentic-ui

首页 发现
看过 我的