SurveyForge – AI自动化学术综述生成框架

SurveyForge是什么

SurveyForge是上海AI Lab联合复旦大学、上海交通大学等机构推出的创新框架，用在自动化生成高质量学术综述。框架基于两阶段设计，大纲生成和内容生成。在大纲生成阶段，基于双数据库协同驱动（研究论文数据库和综述大纲数据库）的启发式学习机制，生成结构合理、逻辑清晰的综述框架。在内容生成阶段，学者导航Agent（SANA）用记忆模块和时间感知重排序引擎，精准检索文献生成高质量内容。SurveyForge的并行生成与协调机制能高效生成连贯的长文档，生成约 64k token的综述仅需 10 分钟，成本不到 0.5 美元。团队构建了 SurveyBench 多维度评估基准，用在客观评估综述的质量。

SurveyForge的主要功能

高效生成综述：SurveyForge能在短时间内生成约64k token的综述，整个过程仅需10分钟，成本不到0.5美元。
高质量大纲生成：基于双数据库协同驱动的启发式学习机制，生成结构合理、逻辑清晰的综述大纲，接近人工撰写的水平。
精准文献检索：学者导航Agent（SANA）能精准检索与主题相关的高质量文献，避免引用无关文献，提升文献的准确性和影响力。
内容优化与协调：jiyu 并行生成与协调机制，各章节独立生成后基于精炼阶段消除重复、理顺逻辑，形成连贯的整体。

SurveyForge的技术原理

大纲生成阶段：
- 双数据库协同驱动：构建研究论文数据库（约60万篇arXiv计算机科学领域论文）和综述大纲数据库（约2万篇综述文章的层次化大纲结构）。基于跨数据库知识融合，检索主题相关论文和已有综述大纲，学习专家级的结构化模式。
- 递归构建策略：先生成体现全局逻辑的一级大纲，再针对每个章节结合领域文献深入细化二级结构，实现由粗到细、由整体到局部的结构化学习。
内容生成阶段：
- 学者导航Agent（SANA）：
  - 子查询记忆模块：将大纲生成阶段检索的文献集合作为记忆上下文，结合原查询，确保查询分解过程始终围绕主题核心，避免语义偏移。
  - 检索记忆模块：将整个大纲相关的文献作为全局记忆，基于嵌入相似度为每个子查询检索最相关的文献，提高检索精度和语义一致性。
  - 时间感知重排序引擎：将检索到的文献按发表时间分组，组内按引用数进行top-k筛选，平衡经典权威文献与前沿新兴研究的代表。
- 并行生成与协调：各章节独立生成内容，基于共享的记忆系统确保围绕统一主题框架，用精炼阶段消除重复、理顺逻辑，形成连贯的整体。