产品评测 2 months ago 213 Views 8 Comments

深度实测通用Agent 2.0,学会全栈开发后把GPT Agent按在地上打了

AI中国
AI中国

Published 10577 Articles

OpenAI GPT Agent以为只比Manus们差了一步,


但7月份带着一堆更新回归的MiniMax Agent告诉它其实已经慢一圈了。


还在卷PPT、可视化网页制作、报告制作的时候,MiniMax已经可以完成:


  • 全栈开发和部署(做出来的网页支持登陆、注册、前后台、以及Stripe支付)


我真的可以搬出那句人人都可以是独立开发者了,这一整套流程都安排好,真的不夸张,这样一套无代码的开发系统,去年是1500左右/月,我都用下不去手。


  • 多模态的输入输出(图片、音频、视频)
  • 定制自己需要的MCP Servers
  • 还支持定时任务(每天更新AI日报都不是压力测试了)



我从快80个真实案例里面分为6大类,一起来看看这个豪华的目录吧:


  1. 全栈开发:开发互动论坛 & Strip支付课程购买网站
  2. 自动化工作流:AI日报 & OpenAI日报(举例)
  3. MCP自建:酒店比价MCP
  4. 多模态内容:图片位置识别 & 30s视频短片生成
  5. 交互式学习:初一数学游戏化学习
  6. PPT制作:有一个好看的案例太想分享了


Here we go!


我跟MiniMax Agent的聊天记录和提示语都打包整理好了,还是老规矩,公众号回复“mmagent”就行,两个m哦


01|全栈开发


MiniMax Agent 应该是第一个敢把“全栈开发”这四个字说出来且确实能做出来的 Agent。



试着用它开发了一个在线论坛,整个需求是 Agent 自己分析出来的:首页要有帖子列表、每个帖子有详情页、支持注册登录、有评论功能,甚至还自动检测登录态安全、接口健壮性这些细节,真像个经验丰富的前端+后端全职程序员做的。


从发到我邮箱里的邮件信息可以看出是接入了Supbase(简单理解成云端数据库),整体逻辑都非常顺,注册、验证、登陆、发帖都没有卡顿,页面之间的路由跳转丝滑得不像AI搭的。



🔗 06f75ewdtw.space.minimax.io


最简单也最困难的登陆功能能做的话,


距离完成一个基础的Saas网页就差个收款功能了。


这一点可能不同的人想法不一致,但是就拿我自己做的网页来说,除了基础UI外,我首先要的是基础的信息整理,比方说ai工具的开源替代(存个20页左右),再加一个登陆功能,吸引用户收藏、评论等等。

真的就差个收款功能了,可能是让用户可以自定义分类,或者提交自己的工具等等。


在MiniMax里加一个新需求:


开发一个带Stripe支付功能的在线课程购买网站



🔗 kcvaoey6ln.space.minimax.io


它就能自己构建商品展示页、添加购物车、生成订单、调用 Stripe SDK 并处理支付成功/失败的回调逻辑,全流程自己跑了一遍测试,交付前还会主动跟你确认体验是否流畅。


总的来说,我能清晰感受到 MiniMax Agent 是有工程意识的,它不是凑页面交差,没有多余的功能,而是真心想交一个“可用”的项目。


02|自动化工作流


现阶段的搜索组件有太多选择了,有AI搜索、联网搜索的MCP、有平台会自带Deep Research或者Deep Search,


所以我前段时间也放弃了继续做每日AI日报,比起每一条信息的压缩和挑选,更难的是要每天更新。



MiniMax Agent算是圆了我一个小遗憾


对信息自动收集来说,我还是建议大家将一个个主体做成独立的信息源,


不然光是要生成全网前十的AI新闻的话,得到的信息只能是非常零碎的,实在不行分平台来收集信息效果都会好点。



制作一个网页,通过后端调用serper API每分钟更新并搜索获取OpenAI新闻。希望整体UI风格接近OpenAI官方网站油画质感。无需手动刷新按钮。


🔗 cth57sk0va.space.minimax.io


那再提升一下,让MiniMax自己用serper API做信息检索、用Gemini API完成内容合成和排版,用Subpase存储最近5天的日报、还要每天八点自动启动工作流:



🔗 q9s4jxcvv6.space.minimax.io


照样可以做,我现在真有点想把AI日报升级一下重新开放出来了,


之前囤的几百个信息源我现在只把一部分做成了Rss,光自己看的话每天都看不过来。


03|MCP自建


这里的开头我挺想引用一下我看到的 @idoubi@深绘 关于MCP的一段对话。我感觉会消除不少人的疑惑,我浓缩摘要了一下:


提问:

说实话,我还是Get不到MCP的点。

这件事的本质,其实就是AI发起一个工具调用请求,服务方给出工具执行结果,AI添加到上下文,然后回答用户或者继续调用。

如果说这是为了统一标准,OpenAPI不是已经是标准了吗?全世界的API都在用OpenAPI文档,AI也能直接读懂,工具调用完了结果该怎么加到上下文还是怎么加,为啥还要搞个MCP?


回复:

a.不是所有 api 都有文档,没有文档 AI 不知道调用什么 API。mcp 在定义工具的时候,相当于是在写文档

b.不是所有写代码的都喜欢对接 api,写一个 mcp client,就能一次性接入很多个 api 提供的功能

c.在 OpenAI 创建的 gpts,你不能在其他地方用。用 mcp 制作的服务器,你可以用在任何 chatbot


AI 时代的万物互联,需要 MCP 这样的协议


那现在MCP Servers的问题是数量还是太少了,想要把自己的服务打包成MCP,我在之前的教程里面也给出了相对简单的实现路线,也要一个固定模版、一套API文档、以及Claude来帮帮场。


在 MiniMax 里,一句话就能搞定:


编写一个能够比较Agoda和Booking酒店价格并包含酒店名称的MCP程序


enmm,提示语就是如此简单,从它的执行过程中看,首先是会找有没有类似的MCP,发现实在是没有之后,就到了程序员的快乐超市Github找了一个“看起来很有前途”的项目(这是它原话)


但是这个库更新的时间已经是很久之前了,所以MiniMax是参考它的结构重新生成了完整的配置文件。



在生成的README里面是有安装说明书的,



添加图片注释,不超过 140 字(可选)


连上ChatWise之后,也是帮我找到了下个月巴厘岛的优惠酒店了



04|多模态内容


接下来就是考考MiniMax的多模态能力,上面的case我都输入的文本,那图片、音频、甚至是视频呢?



分析照片拍摄的确切位置


这个case当时o3 pro出来的时候都在测,很多模型都是蒙的,经不起推敲。


所以MiniMax建立了一个计划文档,首先做图像分析,看到了樱花、大楼、特色的道路设计,然后换了几个不同的搜索源确认哪些地方是以夜樱灯饰出名的,最后搜索了一大堆卫星图像,确定了位置坐标,甚至还推测出了当时是在举办 Midtown Blossom 活动,分析到一半它还会再看一遍图像来刷新记忆。



输入好了,输出怎么样?我不是才更新了视频Agent的横评嘛,所以来吧:


写一个30秒的小故事,主角是一个穿着宇航服的女孩,在下雨天的便利店门口偶遇了未来的自己。要画面氛围感强,补充完整的剧情,有配音和背景音乐



配音很有复古感,而且分了角色,这个很难得,画面整体的逻辑都还不错,成功率也很高。画面的场景和人物一致性也很好,但我看着更像女孩怀念离开的妈妈,不太像遇见未来的自己,剧情这一块可以进一步优化。


05|交互式学习


值得分享还是太多太多了,我们再来个互动感拉满的案例吧,


帮我做一个网站,展示和教学初一数学的所有知识点,数学公式要正常展示,如果有图形几何等知识点要用动画效果教学,索引知识点的方式可以做的像通关游戏一样



🔗 cghopcufj0.space.minimax.io


Amazing啊,能用来学习的Agent又多一个,MiniMax会先拆解教学目标,再根据教学节奏做出章节划分,然后每章配小游戏、小测试和答疑模块,甚至还需要先做对前面几关才能解锁后续。。


所以理论上积分足够的话,


我完全可以在MiniMax Agent里轻松完成搭建一套带前后台、收款、多模态输入输出、有丰富交互细节的网站,还能顺手做出一大堆MCP。


06|PPT制作



帮我做一个新世纪福音战士介绍PPT


虽然PPT不是这次最主要的更新,但是作为Eva厨,从MiniMax出品的PPT页数、背景图片和文本的匹配程度、模块组件的磨砂感和色块、甚至还知道将MAGI这个超级电脑说的话用经典的黑绿命令行模版来说,都可以看出MiniMax这次的提升。


而且从生成过程中看,MiniMax并不是每一步都是成功的,特别是网页信息提取的步骤,但它会将失败的步骤集合起来重新运行,这一操作能降低卡住某个todo的几率。


写在最后


最后一个,真的是最后一个了


宝可梦太可爱了真的。



可能很多人第一次看到 MiniMax Agent,会觉得只是另一个「会写代码的AI」。


但亲自体验一遍之后,我意识到它不是做了一堆网页,而是做了一些“可以上线运营的产品”;不只是跑通了流程,而是成了一次真实世界里的需求闭环。


很多时候,我给的提示语并不完美,它也不是每一步都能一次成功,但你就是能看到,它会不断尝试、不断修复,直到那个「你想要的答案」真的出现。


MiniMax Agent 做到了。


而这,也正是我愿意把它留在常用Agent第一排的理由。


文章来自于“卡尔的AI沃茨”,作者“AI沃茨”。

AI中国

AI中国

10577 Articles 1899880 Views 950300 Fans

Comment (8)

User avatar

这太有趣了,感觉我们人类的地位要被动摇了

User avatar

这简直是AI界的黑暗骑士,谁敢挑战?

User avatar

这比我预测的还要疯狂,GPT Agent直接被碾压

User avatar

这MiniMax Agent太牛逼了,感觉未来AI的竞争格局都改变了

User avatar

我有点害怕,这速度太快了,人类怎么办?

User avatar

太离谱!GPT Agent瞬间被秒,这简直是AI界的爆炸性事件!

User avatar

感觉整个AI界都被它掀过去了

User avatar

这玩意儿简直是GPT的噩梦!

睡觉动画