全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

研究发现：要求 AI 简洁作答可能致其出现更多“幻觉”

IT之家 5 月 8 日消息，巴黎人工智能检测公司 Giskard 发布了一项新研究，指出要求人工智能聊天机器人回答问题时更加简洁，可能会导致其产生更多“幻觉”，即输出不准确或虚假的信息。Giskard 的研究团队在博客中详细阐述了他们的发现。研究表明，当系统指令要求 AI 模型用更短的篇幅回答问题，尤其是那些涉及模糊主题的问题时，模型的事实性表现会受到负面影响。研究人员指出：“我们的数据显示，

马云再谈AI，阿里All in AI战略引关注，员工称绩效未与AI挂钩

阿里巴巴创始人马云近期在公司内部发表讲话，再次强调了人工智能的重要性，并指出未来AI的作用在于解放人类，而非取代人类。此前，市场曾有传闻称阿里巴巴所有部门2025年的绩效考核将以AI驱动的增长为核心指标。针对这一传闻，有阿里员工向媒体表示，目前绩效考核与AI尚未直接挂钩，AI在工作中仍然定位为一种辅助工具。对于此消息的求证，阿里巴巴方面回应称这并非官方发布的信息。值得注意的是，近期马云的频繁公开露

OpenAI 成立非营利委员会，任命四位顾问

IT之家 4 月 16 日消息，人工智能公司 OpenAI OpenAI 公布了其新的非营利性委员会的“顾问”，这四位顾问将帮助“为 OpenAI 的慈善工作提供信息”。这四位顾问分别是：20 世纪著名的劳工活动家多洛雷斯・韦尔塔（Dolores Huerta），大学未来基金会前总裁兼首席执行官、苹果公司董事会成员莫妮卡・洛萨诺（Monica Lozano），健康与福祉基金会“加州捐赠基金会”前

国内首部中医药 AI 大模型评测标准发布，覆盖 13 个能力子域

IT之家 5 月 10 日消息，据央视新闻报道，中国中医科学院联合中国信息通信研究院、中国科学院自动化研究所等研究机构公布了国内首部 AI 中医药大模型评测团体标准。据介绍，相应中医药大模型在评测标准方面覆盖场景丰富度、能力支持度、应用成熟度 3 大能力域。同时还将针对中医药大模型技术适配性、功能实现能力和实际应用价值 3 个维度进行综合评价。在能力子域方面，相应评测标准方面设中医临床诊疗、中医

# AI项目和框架

ImagePulse – 魔搭社区开源的图像理解和生成模型数据集

ImagePulse是什么ImagePulse （图律脉动）是魔搭社区推出的开源项目，为下一代图像理解和生成模型提供数据集支持，通过原子化模型的能力并构建原子能力数据集。项目包含多个原子能力数据集，例如“修改、添加、移除”“放大、缩小”“风格迁移”和“人脸保持”等，每个数据集都针对特定的图像编辑或生成任务。ImagePulse的主要功能原子能力数据集构建：ImagePulse 提供了多

小米米家风扇灯 36 英寸上市：定制全光谱灯珠，国补价 466.65 元起

IT之家 3 月 31 日消息，小米米家风扇灯 36 英寸今日在京东平台上架并开售，售价 549 元，国补价 466.65 元起。IT之家从商品页面获悉，这款新品搭载定制全光谱灯珠，以太阳光谱为基准，模拟真实光照，支持 Ra97 显色指数，色温范围 2700-5700K。经过数次自然采风模拟，预设湖畔、果岭露营、梯田四种户外场景风感模式，正转反转模式可选。一键睡眠模式，根据人体体温昼夜变化，风量

深度操作系统

深度deepin 23.1正式发布！AI默认引擎切换至DeepSeek、修复超百项问题

快科技4月16日消息，今天，深度操作系统宣布，deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题，大幅提升新用户安装体验，同时集成多项功能优化与问题修复，进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等，具体重点改进如下：硬件兼容性与内核优化：集成6.6/6.12内核更新、NVIDIA显卡驱动升级

代码智能体

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星

OpenAI 正式发布了其最新开源项目 Codex CLI，这是一款轻量级的代码智能体工具。该工具的发布迅速引起了极大的关注，仅在短短5小时内，Codex CLI 便突破了5000颗星的评价，预计今天有望突破1万颗星，迅速成为 Github 上的一颗新星。OpenAI 的联合创始人兼总裁 Greg Brockman 表示，Codex CLI 只是他们代码工具系列的第一款，未来将继续推出更多的智能体

初创公司Firecrawl再次寻找AI代理员工，预算100万美元

Y Combinator支持的初创公司Firecrawl再次启动了招聘AI代理的计划，为此专门拨款100万美元。该公司在YC招聘平台上发布了三个"仅限AI代理"的职位，包括内容创作代理、客服工程师和初级开发代理，每个职位月薪均为5000美元。据Firecrawl创始人Caleb Peffer向TechCrunch透露，新职位发布约一周内就收到了约50份申请。然而，正如二月份报道的那样，Firecr

6亿美元融资

DeepMind分拆的Isomorphic Labs 成功融资 6 亿美元，助力 AI 药物研发

Isomorphic Labs 是一家专注于人工智能药物发现的平台，成立于2021年，源自谷歌的 DeepMind。近日，该公司首次获得外部融资，共计6亿美元轮融资由 Thrive Capital 领投，参与者包括 GV 和现有投资者 Alphabet（谷歌母公司）。这笔资金将加速 Isomorphic 的 AI 药物设计引擎的进一步开发，并支持公司将其研发的药物推向临床试验的目标。Isomorp

YouTube打击AI生成内容

为打击 AI 视频乱象，YouTube开启了“去货币化”模式

随着人工智能生成的内容片段涌入平台，人们最终会采取行动来使其失去“货币化”……随着夏季大片和动漫展影片发布季的临近，YouTube 对通过虚假影片和预告片获利的频道采取坚决行动也就不足为奇了。在大量报道显示，在 Screen Culture 等网络创作者利用虚假预告片大肆敛财后，YouTube 开始将利用 AI 生成内容的频道从其合作伙伴计划中移除。YouTube已就如何处理其平台上对主要电影

AI暂时生成不了鲁迅和张爱玲，但别高兴太早

声明:本文来自于微信公众号刺猬公社，作者:陈梅希，授权站长之家转载发布。“你看看篇文章，像不像是AI写的?”一个普通的工作日，我把一篇稿子发给编辑部的同事，随后对此展开AI文风大讨论。这篇稿子短短两千字，却出现了三个“有人认为”，外加三个“有网友认为”。由于正文内容有明显的“端水”动作，即写一段正面观点，立刻跟一段反面观点，我们甚至开始猜测起文本来自哪位AI。给AI断文风，听起来是件很荒谬的

64页论文揭示AI模型排行榜黑幕：Llama4发布前私下测试27个版本，只取最佳成绩

近日，一篇名为《排行榜幻觉》的论文在学术界引发了广泛关注，尤其是对大型语言模型（LLM）领域中备受推崇的 Chatbot Arena 排行榜提出了严厉质疑。研究指出，排行榜的可信度因数据访问不平等、模型私下测试等问题而受到挑战。论文显示，一些大型科技公司可以在公开发布之前对多个模型版本进行私下测试。例如，Meta 在发布 Llama4之前测试了多达27个版本，然后只对外公布表现最佳的模型。这种 “

大语言模型(LLM)

生成式过程奖励模型(GenPRM)

清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM，让小模型超越 GPT-4o

在人工智能领域，随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注，大语言模型（LLM）的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而，在处理复杂推理问题时，如何准确评估模型每一步的回答质量，依然是一个亟待解决的难题。为此，清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM)，为过程监督推理提供了创新解决方案。传统的过程奖励模型（PR

石头 P20 扫拖机器人 5 月 13 日上市，支持机械臂自适应调节

IT之家 5 月 11 日消息，石头科技官宣，P20 自清洁扫拖机器人将于 5 月 13 日上市，支持机械臂自适应调节、98.8% 沿边覆盖率。目前尚不清楚这款新品的具体价格以及参数信息。作为参考，去年 8 月发布的石头 P20 Pro 扫拖机器人，售价 3999 元起，可选水箱版和上下水版。IT之家注意到，石头 P20 Pro 具备 18500Pa 吸力，配备“无界智能底盘”，底盘支持升降功能

人工智能工具

为什么对 AI 越礼貌，它的回答就越详尽？

当你以友好、礼貌的方式向 OpenAI 的生成式 AI ChatGPT 提问时，AI 很可能会给出更详细的答案。然而，这是一个纯粹的数学反应。这并不是说人工智能对我们心存感激并给我们更好的答案。人工智能只是模仿我们的对话模式！当我问 ChatGPT：“为什么我礼貌地提出问题时，会得到更详细的答案？” ChatGPT 回答说：“因为它从训练数据中记录的对话模式中学会了详细回答礼貌问题的倾向。”这