全技术栈开发,让更多的想象力成真了。
进入 2025 这个被誉为「Agent 元年」的下半场,我们见证着一众 AI Agent 的智能水平正朝着同一个新目标快速发展:
用全技术栈把创意直接变成可运行的产品。
就在上周,有媒体报道 AI 独角兽 MiniMax 完成了新一轮融资,公司估值突破 40 亿美元关卡。这家成立三年多的「年轻」公司再一次获得资本青睐。
而就在上个月的 MiniMax Week,他们做了一系列开源动作:从超长上下文的 MiniMax-M1 推理模型,再到 AI 视频模型 Hailuo 02、MiniMax Agent 、Hailuo Video Agent、Voice Design,在各个技术社区引起了广泛关注。
30 天前,MiniMax Agent 产品刚上线时,我们就做了第一时间的全面测评:《MiniMax 的 Agent 做得怎么样?|我们实测了 7 个案例,给出 3 点思考》。
之后我们一直在跟进这款 Agent 产品的更新和迭代。
现在,这位拥有完整 AI 技术栈的实力玩家 MiniMax,又让他们的 AI 原生 Agent 产品完成了一次关键升级——全栈开发能力正式上线。
🚥
接下来的部分,我们将分享完整的评测报告,以及对Agent全技术栈能力的2个核心洞察。
全栈开发让更多的想象力成真了
1)来打造一个「十字路口 Crossroads」播客社区吧!
亮点:深度搜索、视觉识别、支持 Supabase、会员系统、Stripe 付费
MiniMax Agent 现在支持全栈开发,也就是说,前端界面和后端功能可以一起搞
比如我们想做个几乎涵盖所有基础功能的「十字路口 Crossroads」播客社区,就可以输入:
打造「十字路口 Crossroads」播客社区(支持 MiniMax MCP + Stripe 支付) 你是一名全栈开发者,目标是开发一个类似 Spotify 的播客社区平台,命名为「十字路口 Crossroads」。该平台通过调用 MiniMax MCP 接口,将用户上传的播客文稿自动生成语音内容,构建一个围绕播客内容的听、评、聊、付费下载的一站式社区。 🎯 核心目标: • 支持上传播客文稿 → 自动生成 AI 音频 → 发布为可播放内容; • 听是免费的,但下载每个音频需支付 5 美元(通过 Stripe); • 平台具备基础社区互动功能和内容审核机制。
这个时候,MiniMax 会提醒你去 Supabase 注册一下,这是一个 「开源版 Firebase」的系统,可以快速构建后端,不需要自己搭建服务器、数据库和认证系统。
注册流程很简单,MiniMax Agent 会自动提醒并给出网址:
在 Supabase 注册完成后,创建一个项目,剩下的事情就完全不用管了——Agent 会自动处理所有技术对接。
Supabase
我整理了下开发播客社区平台「十字路口 Crossroads」的完整流程,大致分为四个阶段:
第一阶段就是后端搭建,Agent 会自动创建数据库结构,配置文件存储等基础功能。整个过程有详细的执行日志,可以看到每一步在做什么。
剩下三个阶段就是前端开发,用户系统与支付功能,功能完善与上线部署。
任务流程上,我很明显地感受到新版本 MiniMax Agent 现在的「反思」能力更全面了。即使网站已经部署完成,Agent 还会继续优化,添加更多社区互动功能,力求做到完美。
在完成构建并部署上线后,MiniMax Agent 还会进行端到端测试与总结。
可以说,MiniMax Agent 这回最大的特点就是它「端到端」能力提升了一大截:
最后,MiniMax Agent 给出的是一套「前端 + 后端 + 数据库/存储 + 边缘函数 + 支付集成」的完整全栈项目。
你可以下载所有代码文件,也可以将成品网站 Share 给他人(亲测有效):
下面来让我们看看 MiniMax 生成的播客社区,功能有多完整。
首先是网站首页,基本上该有的要素都有了,每一个模块都连接着后台数据库,全部可互动:
MiniMax Agent 提供的这个创建账户功能并不只是个模拟器或者是前端展示,它背后连接了 Supabase,能完整实现注册、激活、登录的全套流程。
比如说,我们可以直接在和 MiniMax Agent 聊天时,把自己的邮箱设为管理员,注册完就能管理整个网站后台了。
当你在上面这个页面系统里注册账户后,会收到来自 Supabase 的邮件,点进去就等于激活账户:
最能体现 MiniMax Agent 全栈能力的就是它提供了完整的后台。
在「个人主页」里,你可以重新设置账号、名称、收藏夹等等;在「上传播客」页面可以完整地上传音频文件。
在「管理后台」的总览页面,我们能看到有多少用户登录了播客社区,还有订单购买时间、收入等数据,全都是实时更新的。
新版 MiniMax Agent 与提示词的一致性更好了。
比如,你如果在提示词里设置一句「登录账户,才可以评论」的功能,出来的成品里就会出现这个新功能,而且所有匿名用户的评论也同样会被记录在网站里:
当然,页面的美观度还有改进空间。
这时候我们可以发挥想象力,一次性给整个网站换个全新风格,比如:
任天堂复古游戏风,低分辨率,黑色背景
MiniMax Agent 的「端到端」能力,让它能够保持极佳的一致性,迅速地为整个网站规划元素相似的风格:
与此同时,我还为这个「十字路口 Crossroads 播客社区」的用户设了一个规则,每个播客售价 5¥:
为了实现付费功能,需要接入 Stripe 支付平台(一家全球在线支付处理平台)的接口。设置过程很简单,MiniMax Agent 会直接给出注册网址,进去注册就行了。
像是下面这样:
这样一来,所有用户登录网站后必须付费才能下载播客音频。
我录制了一段 Gif 展示了具体测试的过程。
当你点击付款按钮后,如果账户余额足够成功支付的话,才可以去下载音频,整个流程很流畅,没有出现功能衔接不了的情况:
我也把这段音频放上来了,是关于「Koji 与鸭哥」的一段访谈内容:
用下来感觉 MiniMax Agent 的工作流程越来越熟练了。主要是因为它的任务起点是「深度搜索」,信息储备很充分,所以最终输出的结果一致性很高。
它能以极快的速度从 0 到 0.99,构建一个完整的平台。
我再举个例子,只是简单输入一段这样的提示词:
把这个播客社区转换成 Spotify 风格,简洁有美感。
MiniMax Agent 在几分钟内就做出了一个工业美学风的播客台:
里面很多元素的一致性非常非常高,且每个播客栏目的封面图与标题之间的协调度也很好。
像是「海洋诗篇」、「街道故事」栏目等等,很文艺:
在实际体验过程中,我还发现 MiniMax Agent 在批量搜索图片和视觉识别方面越来越得心应手了。以前让它做这类任务,它只是按量完成,现在则是追求更高的完成度。
大概就是之前求「做完就行」,而现在是「求精、求好」:
2)一句话就可以构建的「 AI 算命 MCP 」
亮点:搭建可复用 MCP、接入大模型 API
现在,MiniMax Agent 支持一句 Prompt 直接构建 MCP,还能保存到本地或者直接在聊天框里重复使用,甚至保存到工具栏里随时调用。
比如,我想做个「算命服务」MCP:让我输入任何内容,它用「算命大师」的语气来回答,背后调用 MiniMax 的 API 来支持。
就可以输入下面这段提示词,需要的朋友可以直接 Copy:
你是一位全能AI开发助手,请为我创建一个基于MCP协议的“算命服务”MCP服务器。
1. 使用 Python 编写;
2. 支持运行于MCP框架中(例如MiniMax Agent平台);
3. 实现一个名为 fortune_telling 的MCP操作; 4. 用户输入一段描述内容,系统将其作为 user_input 传入;
5. 后端调用大模型,使用如下 prompt: “你是一位通晓命理、星象、八字与塔罗的算命大师,请根据以下内容进行命理解析,要求包含:①性格分析②当前运势③建议,风格神秘隐晦,不给具体时间,只谈趋势,语言富有象征性,不使用现代词汇。用户内容为:{{user_input}}”; 6. 将生成的内容作为 output 返回。 后端调用大模型MiniMax的API,(API Key为______)
MiniMax Agent 几乎简化了中间需要人力操作的复杂步骤。
比如以前最让新手头疼的就是「工具调试」,现在它会自动测试,运行自己做好的 MCP 工具,看结果是否成功输出了:
完成后,你只需要输入几个字和 API Key,就能保存到 MiniMax Agent 里,以后随时复用,这点做的还是挺贴心的:
有了趁手的 MCP 后,我们就可以基于它「随意」开发了。
比如最简单的就是让它做一个前端界面,将 MCP 嵌入其中,构建一个完整的「天机占卜」网站。
提示词如下:
请创建一个充满东方古韵的算命网页前端,用户输入提示词,你调用「算命服务」MCP服务器,输出结果,字体为宋体,体现中华传统文化的深厚底蕴和古典美学:
一个「探天机·观人生·知命运」的古风网站就很迅速地完成了,你可以提问多种类型的问题:
这种一句话就能构建出来的可复用且非常成熟的 MCP,确实为「灵敏开发者」们提供了更多的想象空间。
3)定时全网搜索的「AI 初创公司融资新闻站」
亮点:Cron job 自动运行、全网搜索
MiniMax Agent 现在还支持 Cron job (定时任务),能够更灵活地设定时间间隔,自动运行脚本或命令。
像是,我想用它做一个 AI 初创公司融资信息新闻站,1 分钟更新一次,就可以输入下面这段提示词:
每隔 60 秒自动调用一次 Serper API 使用关键词如 “AI 初创公司融资” 或相关短语进行搜索 从 API 返回结果中提取最新的一条新闻:标题、摘要、来源链接 在页面上显示最新新闻内容,无需手动刷新 页面应自动更新:旧内容被最新内容替换(或可选择以列表形式累积展示)
这里,你需要去 Serper[1] 注册一下拿到 API,这是一个为开发者提供 Google 搜索相关 API 接口的平台,注册完后就可以随时调用它的搜索能力了:
大概几分钟过后,一个比较有科技感又富有动态交互效果的 AI Funding News 网站就顺利建好。
进入这个网站,一开始会有「最新 AI News 雷达搜索」效果的展示。
等它搜索完毕后,来自全网多个信息来源的 AI 初创新闻都被完整地列好,并且每 60 秒可以更新一次:
像是我点击 Reuters(路透社)的一条「美国人工智能初创公司融资激增,数据显示更多风投基金融资受阻」新闻,它会自动跳转到该条新闻所在的网站,整个过程很流畅:
4)高度一致性的「彩虹小熊」PPT
亮点:图片生成、高一致性 PPT
与上回我们介绍 MiniMax Agent 的流程一样。
这回我在试用时,发现它做 PPT 的效果还不错,所以我就准备让它用「彩虹小熊」风格,来给自己的工作流程创建一个完整的 PPT。
提示词如下:
基于我上传的MiniMax Agent工作流程Word文档,创建一个完整的PPT演示文稿,将文档内容进行可视化呈现。 PPT里所有的图片全部用自己生成的可爱彩虹小熊,生成一个萌宠环游世界的主题海报,绘制一系列萌宠在世界各地标志性建筑或风景前的可爱插画。 每一张PPT用一张小熊的插画,如萌宠在埃及金字塔旁玩耍、于中国长城上漫步等,通过色彩鲜艳、形象生动的画面来直观呈现主题;或者设计以萌宠环游世界为主题的海报、贴纸、动画等,在画面中融入地图、飞机、行李箱等旅行元素与萌宠形象相结合,突出主题的趣味性和活力感,吸引观众的目光。
看一看 MiniMax Agent 的效果吧,是不是非常可爱,每一张 PPT 的一致性都很高。
这一整套「MiniMax Agent 智能工作流程」涵盖了它工作时的六个阶段,甚至自动总结出了它的实际案例、功能和技术栈:
整个使用过程非常流畅。虽然复杂任务需要注册一些第三方平台(如Supabase、Stripe),但 MiniMax Agent 会明确告诉你需要哪一步,提供注册地址,让整个流程很清晰。
全技术栈的 Agent 有什么吸引力?
1)技术门槛正在消失,创意与生产力直接挂钩
我还依稀记得几年前,如果想要做个「凑合能用」的网站,你得找前端工程师负责用户看到的页面,找后端工程师处理数据逻辑,还要有人搞定数据库存储。一个简单的网站,可能需要 3-4 个技术人员配合,花费几个月时间。
当 Agent 能够以全技术栈进行 Vibe 开发时,现在只要会说话,说「自然语言」就行,靠感觉、靠想法来开发。
像是一句「做个播客社区」,几分钟后就有了包含用户系统、支付功能、内容管理的完整平台。这不是演示,是真能用的产品。
这种变化最直观的体现就是:想法验证的时间被大幅压缩了。一个有想法的普通人,他的能力被 AI 成倍放大了。
「1 个人的公司」正在快速成真,技术壁垒在消失,但是这同样意味着使用相同 AI 工具可能导致创业者们的产品同质化,如何差异化成为关键。
创意和市场洞察变得比以往任何时候都更重要。
2)端到端能力的需求,比以往任何时候都重要
当市面上出现如此多的 Agent 产品后,用户的品味早已经变得挑剔。AI Agent 不应再满足于「做完就行」,而是追求「做好做精」。
以前的 AI 工具更像个实习生,交代什么做什么。现在更应像个有经验的员工,不仅完成任务,还会主动优化、反思改进。
可以说,「端到端能力」是 Agent 的新 Benchmark(基准测试)。
比如播客平台做完后,它还会自动进行端到端测试,确保每个功能都能正常使用,甚至「是否达到生产级标准」。
什么样的 AI Agent 最会被喜爱?我们总结了下:
【1】Agent 能够在过程中主动进行优化,承认自己做的「不足」,在生成的过程中自动测试各种功能,尽量别麻烦用户;
【2】Agent 需要保持风格统一,换个主题能保持整体设计协调。就像一个有经验的设计师,知道怎么在变化中保持统一感。
🚥
前几天,OpenAI 终于正式展示了他们的 Agent 产品,把 ChatGPT、DeepResearch、Operator 这些技术都封装整合进了一起。
这正好说明,AI Agent 的「故事主线」才刚起了个头。
接下来估计还会有更多公司加入这场「AI Agent」的竞赛,展现他们谁更懂技术、更有品味、更了解用户需求。
不过,大家的终极目标都非常美好:
让有想法的人终于不用再等别人来帮忙实现了。
那么,你想解决什么有创意的问题?又想为谁创造温暖的价值呢?
参考资料
[1]Serper: https://serper.dev/
文章来自于“十字路口Crossing”,作者“镜山”。