标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
95.03万
粉丝
11569
文章
214.41万
总浏览
5
平均评分
AI领域资深专家
【导读】NVIDIA等研究团队提出了一种革命性的AI训练范式——视觉游戏学习ViGaL。通过让7B参数的多模态模型玩贪吃蛇和3D旋转等街机游戏,AI不仅掌握了游戏技巧,还培养出强大的跨领域推理能力,在数学、几何等复杂任务上击败GPT-4o等顶级模型。你肯定玩过贪吃蛇游戏。或许是在诺基亚的单色屏幕上,或许是在童年教室的文曲星里,又或者在喧嚣街机游戏厅里的一角。我们控制着那条像素小蛇,笨拙地转
近日,Apple 机器学习研究团队发布了一篇名为《思考的幻觉(The Illusion of Thinking)》的论文。这篇 53 页的技术报告并非普通评测,而是一记质疑当下主流 LLM 推理能力的重锤。研究者们指出,OpenAI 的“o”系列、Google 的 Gemini 2.5、以及 DeepSeek-R 等所谓“推理型大模型”,本质上并没有从训练数据中学习到可泛化的第一性原理。
智东西6月17日报道,今日凌晨,“大模型六小虎”之一MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,并官宣了为期五天的连更计划。M1参数规模为4560亿,每个token激活459亿参数,原生支持100万上下文输入以及业内最长的8万token推理输出,输入长度与闭源模型谷歌Gemini 2.5 Pro一致,是DeepSeek-R1的8倍。此外,研究人员训练了两个版
当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。为了打破这种局限,让大模型学会“串联”与“并联”知识,上海AI Lab、人大高瓴等团队联合提出了MathFusion,通过指令融合增强大语言模型解决数学问题的能力。仅使用45K的合成指令,MathFusion在多个基准测试中平均准确率提升了18.0个百分点,展现
【导读】编程智能体确实厉害!Transformer作者Llion Jones初创公司,专门收集了NP难题并测试了AI智能体,结果竟在上千人竞赛中排第 21!这意味着,它已经比绝大多数人写得好了。物流路径选择、人员排班、工厂调度、电网平衡、旅行路线……这些贴近现实的优化任务,看似日常,实则难度极高。难点在于:一旦问题规模扩大,传统算法几乎无法计算出最优解。通常只能依赖启发式或近似算法来接近
由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收!这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。ArXiv链接:https://arxiv.org/abs/2410.03751GitHub链接:https://github.com/
一场 ChatGPT 对战 Atari 2600 的象棋对局火了。 具体而言,在一场看似轻松的“AI玩具对决”里,ChatGPT输给了Atari 2600 的象棋引擎,对手只是一台48年前、频率1.19 MHz的8位主机。 起初,这只是Robert Jr. Caruso的一次怀旧实验。这位基础架构工程师,平时和自动化、虚拟化、云计算打交道。某天,他和ChatGPT聊起象棋AI,从Stoc
每一次网购衣服,都是对自我认知的一次刷新。这不是最近 618 大促吗,再次印证了那句“老话”——看买家秀以为是东方不败,到手一穿像衰神二代。更别提尺码合不合适了。谁知道我鼓起多大勇气给客服报上身高体重,可每每都得不到准确建议,“亲,还得偏大一丢丢哦。”算了算了,再多买件XL的吧......最烦的是退货。换个角度想想,店家也心累啊。七天无理由退货政策,让许多买家钻空子,把淘宝店当试衣间,拍完照
无需蒸馏任何大规模语言模型,小模型也能自给自足、联合提升?上海人工智能实验室联合中国人民大学提出的GRA框架(Generator–Reviewer–Adjudicator) 正是这样一种新范式:该方法以“多人协作”、“角色分工”的理念为核心,系统性探索了多开源小模型如何通过协同机制生成高质量训练数据。实验结果显示,在涵盖数学、代码、逻辑推理、通识问答等10个主流数据集上,GRA生成的数据
【导读】谷歌Veo 3的这个视频,已经在全网形成病毒式传播!一刀下去,玻璃水果被一片一片切开,魔性的声音和画面实在让人爽感拉满。网友直呼:太解压了,根本停不下来。谷歌Veo 3,正在掀起全网狂潮。最近,它生成的解压视频,直接在社交媒体上炸了。一个个Q弹的果冻质感水果,被刀切成一片片,伴随着逼真的特效声音,观感那叫一个爽到飞起。不夸张地说,能看一百遍!TikTok上的这位号主「impos