AI热搜榜TOP10 | 事件传播分析&舆情预警 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

芝浦工大创新Vote-based框架，大幅提升手持物体姿态估计精度

在增强现实（AR）等应用中，手持物体的姿态估计是一项至关重要但颇具挑战性的任务。近期，日本芝浦工业大学的研究团队提出了一种基于 Vote 机制的多模态融合框架，显著提高了这一领域的准确性，令人瞩目地提升了13.9% 的姿态估计精度。这一新方法的核心在于有效整合来自 RGB（颜色）和深度图像的数据，特别是在手遮挡物体的情况下。研究团队指出，现有的姿态估计技术往往在手部遮挡时遇到精度下降的难题，而手与

全球第一个会原创的AI来了！马斯克：Grok 3.5将提供互联网上根本不存在的答案

快科技4月30日消息，马斯克把他的第一性原理，也带到了AI大模型上。随着Grok 3的使用和下载量飙升10倍，马斯克宣布，下周，Grok 3.5的早期测试版本将面向SuperGrok订阅者发布。他还透露，这将是第一个可以准确回答有关火箭发动机或电化学技术问题的AI。Grok从第一性原理进行推理，并提出互联网上根本不存在的答案。”马斯克说。换而言之，如果Grok 3.5真的像马斯克所说，那么它将

Takane大语言模型

Nutanix企业AI平台

富士通联手Nutanix推出日语大模型Takane，瞄准企业私有AI市场

富士通与Nutanix达成战略合作，将其专为日语优化的Takane大语言模型（LLM）引入Nutanix企业AI平台(NAI)。这一合作标志着首个日语增强型LLM获得Nutanix AI平台认证，为企业私有AI部署提供了新选择。技术优势:专为日语优化Takane模型针对日语特有的语言挑战进行了优化，包括混合字符集（平假名、片假名和汉字）、省略主语以及日语商务交流中常见的微妙敬语表达。富士通声称，与

谷歌 Gemini Live 功能全面开放，安卓用户迎来新体验

近日，谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户，通过 Gemini Advanced 订阅才能使用。然而，随着用户对 Gemini Live 功能的积极反馈，谷歌决定改变策略，推动这一功能的普及。Gemini Live 功能的强大之处在于它能够实时识别用户手机摄像头和屏幕

全球首个人形机器人半程马拉松完赛，各奖项揭晓

IT之家 4 月 19 日消息，据央视新闻报道，由中央广播电视总台北京总站参与联合主办的全球首个人形机器人半程马拉松今天圆满完赛。完赛奖和各类专项奖发布。IT之家整理奖项如下：第一名：天工队无更换人总用时 2:40’42”，最终 2:40’42”第二名：小顽童队更换一次机器人总用时 3:27’50”，最终 3:37’50”第三名：行者二号队更换两次机器人总用时 4:00’56”，最终 4:25’

1小时暴涨100万用户！GPT-4o新功能彻底杀疯了，免费使用

今天凌晨，OpenAI联合创始人兼首席执行官Sam Altman发布在线急购GPU的消息:如果有人能提供10万单位的GPU资源并能尽快交付，请马上联系我们!同时正在逐步控制局面。但大家应该预料到，由于我们在应对算力方面的挑战，OpenAI的新发布内容将会延迟，可能会出现一些问题，并且服务有时也会变得很慢。仅一个文生图功能，就让GPT-4o这个发布了将近一年的老模型焕发第二春，迎来井喷式用户增长

自回归模型

高分辨率图像

多模态大语言模型

OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

声明:本文来自微信公众号“新智元”，作者:新智元，编辑:KingHZ，授权站长之家转载发布。自回归模型的新突破:首次生成2048×2048分辨率图像!来自Meta、西北大学、新加坡国立大学等机构的研究人员，提出了TokenShuffle，为多模态大语言模型（MLLMs）设计的即插即用操作，显著减少了计算中的视觉token数量，提高效率并促进高分辨率图像合成。图1:采用新技术的27亿参数自回归模

混元大模型

巨人网络《太空杀》引入腾讯AI技术，生成超700万AI玩家

在最近的游戏技术更新中，巨人网络旗下的《太空杀》正式接入了腾讯的混元大模型。这一新功能不仅为游戏注入了活力，还让游戏体验更加丰富。据巨人网络官方公众号透露，自4月28日推出这一功能以来，已经生成超过700万个 AI 玩家，标志着游戏在 AI 原生玩法上的大胆探索。《太空杀》作为一款社交推理类游戏，其核心玩法是让玩家通过推理与交流来找出 “内鬼”。如今，借助腾讯混元大模型，AI 玩家能够以更加智能的

OpenAI o3 模型基准测试成绩遭质疑，实测分数远不及宣称

IT之家 4 月 21 日消息，OpenAI 的 o3 人工智能模型的第一方与第三方基准测试结果存在显著差异，引发了外界对其公司透明度和模型测试实践的质疑。去年 12 月，OpenAI 首次发布 o3 模型时宣称，该模型能够在 FrontierMath 这一极具挑战性的数学问题集上正确回答超过四分之一的问题。这一成绩远远超过了竞争对手 —— 排名第二的模型仅能正确回答约 2% 的 Frontie

教育部划清AI使用边界:小学到高中分阶段引导，禁止复制AI答案

教育部于5月12日正式发布《中小学人工智能通识教育指南（2025年版）》和《中小学生成式人工智能使用指南(2025年版)》(简称《使用指南》)，旨在科学规范推进人工智能全学段教育。《使用指南》明确规定，禁止学生直接复制人工智能生成内容作为作业或考试答案，并限制在创造性任务中滥用人工智能。此举意在从源头上杜绝"代劳式"使用行为，防止学生过度依赖AI而弱化独立思考能力。图源备注：图片由AI生成，图片授

AIGC作品监管

内容创作限制

人工智能内容标识

社交平台封禁

互联网平台现状：鼓励AI，限制AI

声明:本文来自于微信公众号新莓daybreak，作者:何聆筝，授权站长之家转载发布。一场针对AIGC作品的限制，正规模化地席卷各个平台。一些AIGC创作者在小红书拉起群组，分享自己被限制的经历。有人发布12星座内容被判定「传播封建迷信」，有人因为生成AI明星而遇到「侵权」提示。「虚构事件」和「假冒真人」是最常被引用的处罚理由。同样的情况也发生在视频号和抖音，大量AIGC作品遭遇下架和封禁。作品

人工智能医疗记录审核

临床质量管理

初创公司 Brellium 获 1670 万美元融资，助力医疗记录审核的智能化升级

初创公司 Brellium 近日宣布获得1670万美元的 A 轮融资，资金将用于扩大其基于人工智能的医疗记录审核解决方案。这一技术旨在帮助医疗机构自动化临床质量管理和保险合规，从而提升医疗服务的效率与准确性。Brellium 的联合创始人扎克・罗森（Zach Rosen）在一次个人经历中深刻感受到医疗文档的疏漏可能对患者造成的严重影响。多年前，他因医疗误诊而经历了长达两年的挫折，频繁奔波于各类专家

谷歌突发大招刷爆AI编程榜，网友：不用买Cursor了

声明：本文来自微信公众号“量子位”，作者:白交，授权站长之家转载发布。因为大家太过热情， Gemini2.5提前重磅更新——史上最强编码模型Gemini2.5Pro Preview的I/O版。只需一张手绘的草图，就可以构建一个「绘图变音频」的网页版应用。其他游戏、对象模拟等等也都可以通过一句提示完全搞定。它在所有LMArena排行榜上均超越Claude位列第一，包括所有文本领域、视觉以及Web

大厂混战AI笔记:快手“喵记多”能否复制Notion增长神话?

快手近日推出了一款名为“喵记多”的全新App，正式进军AI辅助的笔记工具市场。该产品由快手旗下的轻雀科技开发，核心亮点在于集成了一个名为“喵仔”的智能助手，用户可以通过聊天交互的方式完成笔记管理和待办提醒。据悉，“喵记多”的主要功能包括笔记剪藏、内容整理和记忆搜索。用户可以将零散的文字、图片、文件等发送给喵仔，并通过长按消息选择“喵记一下”将其转化为笔记，方便后续编辑和管理。直接向喵仔发送“记笔记

多模态处理

OpenAI 推出全新推理模型 o3，实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini，标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本，还首次实现了图像思考的能力，能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型，尤其在编程和数学等任务中表现出色，准确率高达87.5%。这次发布的 o3和 o4-mini 模型在多模态处理上表现出色，具备了图像处理、网页搜索和代码执行等功能。

AI数字化转型

公共部门解决方案

HCLTech 在美国推出 AI 驱动的公共部门新子公司

HCLTech 近日宣布成立新子公司 ——HCLTech 公共部门解决方案（PSS），旨在推动美国政府机构的人工智能(AI)数字化转型。该子公司将专注于为州和地方政府、教育组织(SLED)以及联邦平民和国防机构提供服务，借助 HCLTech 在综合技术解决方案方面的数十年经验。这一举措进一步加强了 HCLTech 在公共部门的扩展，特别是在去年11月成立的战略细分市场业务背景下，标志着公司在公共领