成本降低88%：阿里巴巴ZeroSearch技术颠覆AI训练模式

4.8

0热度

阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术，彻底改变了训练人工智能系统搜索信息的方式。这项创新技术通过模拟方法让大型语言模型（LLM）开发高级搜索功能，无需在训练过程中与真实搜索引擎交互，从而消除了对昂贵商业搜索引擎API的依赖。解决成本与复杂性难题ZeroSearch解决了AI行业面临的两大关键挑战:搜索引擎返回文档质量的不可预测性，以及向谷歌等商业搜索引擎进行数十

阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术，彻底改变了训练人工智能系统搜索信息的方式。这项创新技术通过模拟方法让大型语言模型（LLM）开发高级搜索功能，无需在训练过程中与真实搜索引擎交互，从而消除了对昂贵商业搜索引擎API的依赖。

解决成本与复杂性难题

ZeroSearch解决了AI行业面临的两大关键挑战:搜索引擎返回文档质量的不可预测性，以及向谷歌等商业搜索引擎进行数十万次API调用所产生的高昂成本。

研究人员在本周发表于arXiv的论文中指出:"强化学习[RL]训练需要频繁部署，可能涉及数十万个搜索请求，这会产生大量的API开销，并严重限制可扩展性。为了应对这些挑战，我们推出了ZeroSearch，这是一个强化学习框架，无需与真实搜索引擎交互即可激励LLM的搜索能力。"

创新的训练方法

阿里巴巴的方法首先采用轻量级的监督式微调，将LLM转换为能够根据查询生成相关和不相关文档的检索模块。在强化学习训练过程中，系统采用"基于课程的推出策略"，逐步降低生成文档的质量。

研究人员解释道:"我们的关键见解是，LLM在大规模预训练过程中获得了广泛的世界知识，能够根据搜索查询生成相关文档。真实搜索引擎和模拟LLM之间的主要区别在于返回内容的文本风格。"

性能超越传统方法的同时大幅降低成本

在七个问答数据集的全面测试中，ZeroSearch不仅匹敌，甚至经常超越使用真实搜索引擎训练的模型。令人印象深刻的是，一个70亿参数的检索模块实现了与谷歌搜索相当的性能，而140亿参数的模块甚至超越了后者。

成本节省更是显著:通过SerpAPI使用Google搜索进行约64，000个查询的训练成本约为586.70美元，而在四台A100GPU上使用14B参数模拟LLM的成本仅为70.80美元，节省了88%的费用。

论文结论指出:"这证明了在强化学习设置中使用训练有素的LLM替代真实搜索引擎的可行性。"

对AI行业的深远影响

这一突破标志着AI训练方式的重大转变。ZeroSearch表明，AI系统可以通过自我模拟而非依赖外部工具来实现功能改进，为行业带来多重益处:

降低进入门槛:对预算有限的初创公司和研究团队，API调用成本降低近90%使高级AI训练更加平民化
增强控制能力:开发者可以精确控制AI训练过程中接触的信息，不再受制于搜索引擎返回结果的不确定性
适用性广泛:该技术已在多个模型系列上得到验证，包括Qwen-2.5和LLaMA-3.2的基础版本和指令调整版本

研究团队已在GitHub和Hugging Face上公开了相关代码、数据集和预训练模型，鼓励行业广泛采用这一创新方法。

随着大型语言模型继续发展，ZeroSearch这样的技术预示着未来AI系统将能通过自我模拟而非依赖外部服务来开发更复杂的功能，这可能从根本上改变AI开发的经济性并减少对大型技术平台的依赖。

讽刺的是，在教AI无需搜索引擎进行搜索的过程中，阿里巴巴可能创造了一项让传统搜索引擎对AI发展不再那么重要的技术。随着这些系统变得更加自给自足，技术格局可能在未来几年内发生巨大变化。

本文分类：AI热点
本文标签：无
浏览次数：172 次浏览
发布日期：2025-05-09 09:09:36
本文链接：https://aichina360.com/AIredian/oYvKmP40Ggdx194aP1RVjJ3NDbkBpWMl.html
声明：内容来源于公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱aichina360@163.com，并在邮箱中提供有效版权证明文件给我们，我们将第一时间进行处理。

上一篇 > Meta任命前谷歌DeepMind主管为AI研究实验室新负责人
下一篇 > 告别对话断层：Mem0动态存储技术实现AI代理记忆永续

成本降低88%：阿里巴巴ZeroSearch技术颠覆AI训练模式

解决成本与复杂性难题

创新的训练方法

性能超越传统方法的同时大幅降低成本

对AI行业的深远影响

评论列表共有 0 条评论

发表评论取消回复

成本降低88%：阿里巴巴ZeroSearch技术颠覆AI训练模式

解决成本与复杂性难题

创新的训练方法

性能超越传统方法的同时大幅降低成本

对AI行业的深远影响

四部门联合发布《人工智能生成合成内容标识办法》，9 月 1 日起施行

打工人福音！Genspark推出AI Sheets，聊聊天就能把表格数据处理了

告别对话断层：Mem0动态存储技术实现AI代理记忆永续

秘塔AI搜索上线“讲题”功能 降低家长辅导门槛

评论列表 共有 0 条评论

发表评论 取消回复

秘塔AI搜索上线“讲题”功能降低家长辅导门槛

评论列表共有 0 条评论

发表评论取消回复