AI热点 2 hours ago 100 Views 0 Comments

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

AI中国
AI中国

Published 8489 Articles

白交 发自 凹非寺量子位 | 公众号 QbitAI

最强开源深度研究模型来了。

MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。

首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

其次,它是真·全开源可复现,它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。

而据代季峰的朋友圈透露,他们将保持每月一次开源的更新速度。而这个项目是他们团队经过一个季度的努力而实现的。

从他们提供的演示来看,似乎都是在手机端上进行,因此不排除之后他们在手机端部署的可能性。

目前,他们还开放了Demo可以体验。

最强开源深度研究模型

在Demo体验区有这样一句介绍,我们不提供AI(我们只是AI的搬运工),我们与您共同构建它。

好好好,说回到这个项目体验,目前它还属于比较早期,仅支持单轮次、且英文的对话输入。

随便选一个推荐问题上去,能够看到,它的思考过程和最终结果有很明显的分区。

思考过程左侧还有工作流的导览指引,你可以选择指定的节点进行查看。

过程中能够看到它支持联网搜索的。

最后的结果呈现得也比较清晰。

与现有的深度研究方法相比,MiroMind ODR项目开放了深度研究的各个阶段,包括四个子项目:

MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)和MiroTrain(训练基础设施)。

MiroFlow,支持多种主流工具调用,扩展大语言模型,支持工具辅助的深度研究推理。它的亮点在于可以稳定复现最强性能,也就是GAIA上82.4的成绩。

MiroThinker,原生支持工具辅助推理的大语言模型,可训练、可复现,在 GAIA 中表现最佳。

此外,它在GAIA-Text-103上取得了SOTA性能(60.2%),接近 OpenAI Deep Research。

MiroVerse,147K开源训练数据支持深度研究训练。此外团队还会关注社区反馈,每月持续提供高质量、深入的研究数据集。

MiroTrain,支持深度研究模型的稳定高效训练,覆盖整个Deep Research训练流程,支持长文本训练和RL训练工具。

不过除了这个项目之外,在GitHub上还看到了他们几周之前的成果MiroMind-M1。

MiroMind-M1是一系列基于Qwen-2.5 完全开源推理语言模型,专注于提升数学推理能力。

该模型通过监督式微调(SFT)在 719K 个精心筛选的问题集上进行训练,并采用可验证奖励的强化学习(RLVR)在 62K 个具有挑战性的示例上进行优化,使用了基于上下文的多阶段策略优化方法(CAMPO)。

在AIME24、AIME25和MATH500上,在基于7B Qwen-2.5的开源模型中取得了最佳性能。

代季峰加盟盛大后首秀

这个项目中的核心人物,自然是代季峰这位大牛。

个人网站上依旧显示其清华大学电子工程系副教授岗位。

公开信息显示,代季峰在计算机视觉、深度学习领域发表国际期刊、会议文章80余篇,论文总引用6万余次。

他是R-FCN物体检测算法和Deformable ConvNets的作者。R-FCN被评价为“三大目标检测元模型之一”;而研发的Deformable ConvNets,性能超越微软、Meta、谷歌等机构的视觉大模型

他主导开发的InternVL多模态基础模型,是最具影响力的开源多模态基础模型之一,被广泛应用于工业界和学术界,Hugging Face下载量超过1千万次。

2009年和2014年于清华大学自动化系分别获得工学学士和博士学位。

随后微软亚洲研究院视觉组工作,担任首席研究员、研究经理。

2019年来到商汤的研究院工作,担任执行研究总监。直到2022年选择回归学界担任副教授。

这次选择再次出山,是为AGI而来。

据科创板日报消息,他加盟陈天桥旗下的盛大网络,正筹备一家新的AI创业公司,目标是打造第二个DeepSeek,将围绕AGI展开基础性研究。

这个公司有三个研发重点:AI商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。

不过从MiroMind官网上也能看到出一些端倪,他们的使命是我们正在打造具备自我意识的数字生命体,与社区共同进化,以实现安全、有益的AGI惠及所有人。

所以,此次MiroMind ODR既是MiroMind的正式亮相,同样也是代季峰面向AGI的技术首秀。

Blog: https://miromind.ai/blog/miromind-open-deep-researchDemo: https://dr.miromind.ai/GitHub: https://github.com/MiroMindAIHugging Face: https://huggingface.co/miromind-ai

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

AI中国

AI中国

8489 Articles 1363012 Views 950300 Fans

Comment (0)

Popular Authors

AI中国

AI中国

8489 Articles 95.03万 Followers

IT之家

IT之家

1221 Articles 5.64K Followers

人人都是产品经理

人人都是产品经理

512 Articles 5.87万 Followers

钛媒体APP

钛媒体APP

435 Articles 0 Followers

36氪

36氪

402 Articles 5.63K Followers

睡觉动画