AI热搜榜TOP10 | 事件传播分析&舆情预警 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

多模态推理模型

多模态联合强化学习

verifiablereward

阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

阶跃星辰科技团队宣布正式推出全新的多模态推理模型 Step-R1-V-Mini。这一模型的发布标志着在多模态协同推理领域的新突破，为AI技术的进一步发展注入了新的活力。Step-R1-V-Mini支持图文输入和文字输出，具备良好的指令遵循能力和通用性，能够高精度感知图像并完成复杂的推理任务。Step-R1-V-Mini的训练方法在技术上进行了创新，采用了多模态联合强化学习，基于PPO（Proxim

Llama3.1NemotronUltra253B

英伟达发布Llama 3.1 Nemotron Ultra 253B：性能超群的技术新标杆

2025年4月8日，英伟达推出Llama3.1Nemotron Ultra253B，这一基于Llama-3.1-405B优化的开源模型以253亿参数超越Meta的Llama4Behemoth和Maverick，成为AI领域焦点。该模型在GPQA-Diamond、AIME2024/25及LiveCodeBench等测试中表现卓越，推理吞吐量达DeepSeek R1的四倍。通过优化训练和算法，英伟达证

DeepCoder-14B-Preview

开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型

在科技发展的浪潮中，人工智能（AI）技术日新月异。最近，由著名大模型训练平台 Together AI 和智能体平台 Agentica 联合开源的新模型 DeepCoder-14B-Preview，吸引了广泛关注。该模型以仅有的140亿参数，在代码测试平台 LiveCodeBench 上的得分为60.6%，超过了 OpenAI 的 o1模型（59.5%），仅略低于 o3-mini(60.9%)。这一

Llama3.1NemotronUltra253B

大语言模型

英伟达震撼发布Llama 3.1 Nemotron Ultra 253B：AI性能王者再定义行业新标杆

近日，全球芯片与AI技术巨头英伟达（NVIDIA）推出了一款全新开源大语言模型——Llama3.1Nemotron Ultra253B，引发了人工智能领域的强烈反响。这一模型基于Meta的Llama-3.1-405B打造，通过创新技术优化，不仅在性能上超越了Llama4Behemoth和Maverick等强劲对手，还以高效的资源利用率和卓越的多任务能力，为AI应用的广泛落地提供了新的可能。Llam

检索增强生成

Cloudflare发布AutoRAG：全托管RAG系统简化AI上下文感知开发

近日，全球云服务巨头Cloudflare正式推出了一款全托管的检索增强生成（Retrieval-Augmented Generation，简称RAG）系统——AutoRAG。这一创新工具的亮相，为开发者提供了一个高效、便捷的解决方案，使其无需手动构建复杂的索引、检索或嵌入流程，仅通过指向数据源即可快速搭建具备上下文感知能力的AI系统。这一技术的推出，不仅降低了AI开发的门槛，也为企业智能化转型注入

Cursor编辑器

Notion API迎来MCP服务器，AI交互能力大幅提升

notion-mcp-server 项目近日发布，为 Notion API 实现了 MCP（Model Context Protocol）服务器。这一突破性的进展使得人工智能应用，如 Cursor 编辑器和 Claude，能够通过标准化的 MCP 协议与 Notion API 进行无缝交互。这意味着用户现在可以直接通过自然语言指令或内容ID，让AI理解并操作其Notion数据库和页面，极大地拓展了

Llama3.1NemotronUltra253B

大型语言模型(LLM)

神经架构搜索(NAS)

英伟达(NVIDIA)

英伟达发布Llama3.1 Nemotron Ultra 253B，性能超越Llama 4 Behemoth

2025年4月8日，英伟达（NVIDIA）宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instruct开发，通过创新的神经架构搜索(NAS)技术进行了深度优化，不仅在性能上超过了近期发布的Llama4系列中的Behemoth和Maverick，还以开源形式在Hugging Face平台上发布，引发

生成式AI模型

DeepCoder-14B发布：开源AI编码神器媲美o1与o3-mini，解锁技术新边界

近日，一款名为“DeepCoder-14B”的全新AI模型正式亮相，这一由Agentica团队与合作伙伴共同打造的开源项目迅速引发了全球科技界的热议。作为一款专为编码推理设计的生成式AI模型，DeepCoder-14B以其卓越的性能跻身行业顶尖水平，据称可与OpenAI的o1和o3-mini相媲美。更令人振奋的是，研发团队不仅开放了模型本身，还一并发布了其完整数据集、源代码和训练方法，这一罕见的透

自主演原则的批判调优(SPCT)

大型语言模型(LLM)

AI奖励模型(RewardModels)

推理性能再飞跃!DeepSeek推创新技术SPCT，让大模型更懂人心

备受瞩目的中国人工智能研究实验室DeepSeek AI，继其强大的开源语言模型DeepSeek-R1之后，再次在大型语言模型（LLM）领域取得重大突破。近日，DeepSeek AI正式推出一项名为自主演原则的批判调优(Self-Principled Critique Tuning，简称SPCT)的创新技术，旨在构建更通用、更具扩展性的AI奖励模型(Reward Models，简称RMs)。这项技术

斯坦福2025 AI指数报告震撼发布：中美AI差距仅剩0.3%，全球技术竞赛白热化

近日，斯坦福大学人类中心人工智能研究所（HAI）发布了备受瞩目的《2025年人工智能指数报告》。这份长达数百页的权威报告，全面梳理了2024年全球AI领域的最新趋势和技术进展，揭示了人工智能在性能提升、成本下降及全球应用上的惊人变化。从中美顶级模型差距的急剧缩小，到AI医疗设备的快速普及，再到亚洲与西方对AI态度的显著分化，这份报告为我们勾勒出一幅AI技术迅猛发展与全球竞争加剧的壮阔图景。性能差距

Quartz 被出售并进行大裁员，AI 内容转型惹争议

最近，曾经享有盛誉的商业出版物 Quartz 在经历了一场引发广泛争议的 AI 内容转型后，几乎全体编辑团队被裁员，并且被出售给了一家加拿大软件公司 Redbrick。Quartz 的创始人之一扎克・苏尔德（Zach Seward）在一篇博客中表示，Quartz 自2012年成立以来已经换了几次主人，此次的变动再次凸显了媒体行业的动荡。在去年，Quartz 被数字媒体巨头 G/O Media 收购

AI生产力工具

谷歌NotebookLM即将推出移动应用程序版本

谷歌旗下人工智能研究工具 NotebookLM 即将推出独立的客户端应用程序。这一进展标志着这款备受关注的 AI 助手从网页端走向更广泛的移动端应用场景，为用户提供更便捷、高效的使用体验。作为谷歌在 AI 生产力工具领域的又一力作，NotebookLM 的此次升级引发了业界和用户的广泛期待。从实验到落地:NotebookLM 的演进NotebookLM 最初于2023年以 “Project Tai

大语言模型

API聚合服务

模型调用次数

OpenRouter调整API政策：重新定义免费与付费模型调用限制

2025 年 4 月 9 日报道：知名大语言模型API聚合服务商OpenRouter近日宣布重大政策调整，对其免费模型调用限制进行了显著变更。根据最新消息，该平台已将每日免费模型调用次数从原先的 200 次调整至 50 次，同时推出新的激励措施——账户余额超过 10 美元的用户将享有每日 1000 次的调用上限。这一政策变更在开发者社区引发了广泛讨论，反映了AI服务提供商在快速发展市场中的战略调整

自动化测试

OpenAI发布Evals API：AI模型测试进入程序化新时代

近日，人工智能领域的领军企业OpenAI宣布正式推出Evals API，这一全新工具的亮相迅速引发了开发者和技术圈的热烈反响。据悉，Evals API支持用户通过编程方式定义测试、自动化运行评估流程，并实现对提示（Prompt）的快速迭代优化。这一功能的发布，不仅将模型评估从手动操作推向了高度自动化的新阶段，也为开发者提供了更灵活、高效的工具，以加速AI应用的开发与优化。Evals API的核心在

Anthropic官方发布！大学生Claude AI使用报告大公开

人工智能（AI）系统不再只是专业的科研工具，它们已经成为大学生日常学习中不可或缺的伙伴。随着AI更深入地融入教育环境，需要认真思考关于学习、评估和技能发展的重要问题。以往的讨论大多依赖于调查问卷和控制实验，而缺乏对学生在真实场景中如何自然地将AI融入学业工作的直接证据。为了弥补这一空白，研究进行了一项大规模研究，分析了Claude.ai上百万条匿名学生对话，旨在了解大学生真实世界中的AI使用模式。

富国银行 AI 助手 Fargo 交互量突破 2.45 亿，安全高效引领行业

富国银行近日宣布，其 AI 助手 Fargo 在 2024 年的交互量已突破 2.45 亿次，成功实现了原本设定目标的两倍。这一系统以安全为前提，通过采用谷歌的 Flash 2.0 技术，实现了高效且安全的客户服务，避免了敏感客户数据的泄露。Fargo 的主要功能是帮助用户处理日常银行事务，包括支付账单、转账、查询交易详情及回答账户活动相关问题。用户在使用时，可以通过语音或文本进行互动，系统的用户