AI自我进化神器!Self-Refine让GPT-4输出飙升20%,无需训练即可搞定!

Self-Refine方法因其通过自我批评与反思显著提升大语言模型(LLM)输出质量,再度成为AI研究热点(https://arxiv.org/abs/2303.17651)。这一创新框架让单一LLM通过生成、反馈、优化的循环,自主迭代输出,无需额外训练或外部工具即可实现约20%的性能提升。AIbase观察到,Self-Refine对包括GPT-4在内的先进模型均有效,引发了开发者与研究者的广泛讨

骁龙7Gen4发布 AI性能比前代提升65%

站长之家(ChinaZ.com)5月16日 消息:高通正式推出骁龙7系列新成员——第四代骁龙7(骁龙7Gen4),旨在为高端手机用户提供准旗舰级的性能、连接性与娱乐体验。全新的第四代骁龙7在多媒体体验上表现出色,多个IP模块协同工作,配合台积电4nm工艺,整体能效优异。CPU部分首次采用1+4+3的全新架构组合,包含一个2.8GHz的超级核心A720、四个2.4GHz的性能核心A720以及三个

​Salesforce 收购 Moonhub,强化 AI 招聘工具

近日,Salesforce 公司悄然收购了 Moonhub,这是一家专注于招聘和人力资源管理的人工智能初创公司。虽然收购的具体条款尚未公开,但这一消息引发了业界的广泛关注。图源备注:图片由AI生成,图片授权服务商Midjourney根据 Moonhub 在其官方网站上发布的声明,公司的整个团队将加入 Salesforce。Moonhub 首席执行官 Nancy Xu 表示,作为客户和投资者,Sal

OpenAI开源BrowseComp,衡量 AI 代理浏览网页能力的新基准

人工智能领域的测试标杆再添新成员!OpenAI宣布开源BrowseComp,一个专为评估AI代理网络浏览能力设计的创新基准测试。这一举措不仅为AI研究社区提供了全新的工具,也为推动更智能、更可靠的浏览代理奠定了基础。AIbase为您深入解读BrowseComp的核心价值与行业影响。BrowseComp:AI浏览能力的“终极试炼”BrowseComp,全称“Browsing Competition”

Wayve推完整世界模型GAIA-2:支持同时生成5个视角的视频,可模拟高风险场景

Wayve公司近日隆重推出了其最新的视频生成世界模型——GAIA-2。 这一突破性的技术是其上一代模型GAIA-1的重大升级,旨在通过生成高度多样化和可控的驾驶场景视频,极大地推动辅助和自动驾驶系统的安全性发展. GAIA-2的发布标志着Wayve在利用生成式人工智能技术赋能更安全、更智能的出行方面迈出了坚实的一步。GAIA-1的飞跃:场景多样性全面提升与GAIA-1相比,GAIA-2最显著的提升

Reddit起诉Anthropic非法抓取数据训练Claude:要求删除所有含Reddit内容的AI模型

Reddit已在旧金山高等法院对人工智能公司Anthropic提起诉讼,指控其未经许可系统性抓取Reddit帖子训练Claude语言模型,违反平台用户协议和商业使用规定。这起诉讼凸显了AI训练数据获取的法律争议,以及内容平台与AI公司之间日益紧张的关系。Reddit要求法院强制Anthropic删除所有包含Reddit内容的AI模型和数据集,并禁止其将基于Reddit数据训练的AI模型用于商业用途

赛力斯申请Ai link商标

企查查APP显示,近日,赛力斯汽车有限公司申请注册多枚"Ai link""AITO Link"商标,国际分类涉及运输工具、科学仪器等,当前商标状态均为注册申请中。

OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞

IT之家 5 月 30 日消息,安全专家 Sean Heelan 于 5 月 22 日发布博文,报道称在 OpenAI 的 o3 推理模型帮助下,他成功发现了 Linux 内核重大零日漏洞,追踪编号为 CVE-2025-37899。Heelan 表示最初仅打算通过代码审计,测试 OpenAI 的 o3 推理模型,却意外发现 AI 能自主识别复杂的“use-after-free”漏洞,存在于 Li

​谷歌推出 LMEval:统一评估大语言与多模态模型的新工具

近日,谷歌宣布推出 LMEval,这是一个开源框架,旨在简化和标准化对大型语言和多模态模型的评估。该工具为研究人员和开发者提供了一个统一的评估流程,可以方便地对来自不同公司的 AI 模型进行比较,比如 GPT-4o、Claude3.7Sonnet、Gemini2.0Flash 和 Llama-3.1-405B 等。以往,对新 AI 模型的比较往往比较复杂,因为各个提供商使用自己的 API、数据格式

米哈游蔡浩宇新作iPhone实机演示:10分钟就被AI小美撩到脸红,她的命运由我拯救

声明:本文来自于微信公众号 量子位,作者:白交 克雷西,授权站长之家转载发布。米哈游蔡浩宇的AI游戏,实机演示片段曝光!没想到视频那头的NPC「小美」一句话,直接把人类「小帅」给撩到脸红了。看着眼含深情的「小美」语气温柔地说着土味情话,试问谁能不心动。这个「小美」叫做Stella,正是上个月曝光的AI游戏《Whispers From The Star》里的主角。她意外坠落在了一个外星星球上,而

月之暗面Kimi开源数学定理证明模型Kimina-Prover

 Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,

Kimi-Audio – Moonshot AI 开源的音频基础模型

Kimi-Audio是什么Kimi-Audio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训练,具备强大的音频推理和语言理解能力。核心架构采用混合音频输入(连续声学 + 离散语义标记),结合基于 LLM 的设计,支持并行生成文本和音频标记,同时通过分块流式解码器实现低延迟音频生成。Kimi-Audio

字节跳动发布开源代码模型Seed-Coder,8B参数引领编程新风潮

字节跳动Seed团队正式推出全新开源代码模型Seed-Coder,以其卓越的代码生成、补全、编辑及推理能力引发业界广泛关注。作为一款8B参数规模的模型,Seed-Coder在多个基准测试中超越同级别竞品,展现出强大的编程潜力和高效的数据处理设计。模型概览:8B参数,32K上下文,MIT协议开源Seed-Coder是一个专注于代码生成、编程和软件工程任务的模型系列,包含三个主要变体:Seed-Cod

刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经

日本东京日比谷公园推出 AI 分析鸟鸣识别种类服务,便于游客寻找喜爱鸟类

IT之家 4 月 30 日消息,据共同社今日报道,日本东京都千代田区的日比谷公园上线了一项 AI 服务 —— 利用 AI 分析鸟鸣声后,可以识别鸟类的种类、位置,游客可以通过智能手机进行查询。该服务由东京的音频相关初创企业“Hylable”开发。Hylable 公司呼吁人们随意使用这项服务,以了解东京都中心地区的生态系统。IT之家从报道中获悉,AI 能够学习在该公园收录的鸟鸣声,并将其与识别声源