全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

清华大学与面壁智能发布端侧GUI Agent:AgentCPM-GUI

近日，清华大学THUNLP实验室联合面壁智能推出了一款创新的端侧GUI Agent——**AgentCPM-GUI**，为移动设备的人机交互带来全新突破。该智能体基于**MiniCPM-V**模型构建，总参数量仅**8B**，以手机屏幕图像为输入，支持中英文操作，可自动执行用户提出的任务，展现出强大的GUI元素定位能力。AgentCPM-GUI覆盖了包括**高德地图**、**大众点评**、**B站

vivo发布 “蓝极星计划”，全球招募顶尖博士，薪资无上限

在激烈的人才争夺战中，vivo 近日宣布启动一项名为 “蓝极星” 的全球人才招募计划，重点面向芯片、人工智能大模型等高科技领域。该计划旨在吸引全球顶尖的博士生，进一步推动 vivo 在技术研发上的创新。“蓝极星计划” 被视为 vivo 的核心人才战略，计划招募约100名专家。这些岗位涵盖了多个技术领域，包括虚拟现实（XR）、人工智能大模型、影像处理、芯片设计以及器件开发等。为了满足顶尖人才的需求，

Gmail 新功能上线：Gemini AI 助力轻松管理日历事件

在2025年的 I/O 开发者大会上，谷歌宣布其移动邮件应用 Gmail 将全面整合 Gemini AI 功能，为用户带来更便捷的日历管理体验。无论是 Android 还是 iOS 平台，用户都可以通过 Gmail 应用轻松创建、删除和编辑日历事件，并查看每日日程概览。据悉，这一新功能允许用户在 Gmail 内直接管理日历，无需切换到其他应用。用户只需点击 Gmail 应用中的 “Ask Gemi

OpenAI 反诉马斯克，指责他想当 “AGI独裁者”！

法庭文件称，马斯克必须停止对 OpenAI “无休止” 的攻击。站长之家(ChinaZ.com) 4月11日消息:昨日，OpenAI 反诉埃隆・马斯克，指责马斯克故意选在特定时机，以“虚假报价”为幌子，企图较大程度地扰乱、甚至可能吓跑那些诚心投标的投资者。OpenAI 抨击马斯克想当成为 “通用人工智能独裁者”，并表示，如果马斯克多年来 “无休止” 的 “骚扰” 行动不被制止，他最终可能真的

SmolVLM登场！WebGPU驱动实时网络摄像头AI，零服务器、本地运行，点开网页秒体验！

Hugging Face推出的SmolVLM多模态模型迎来重大突破:通过WebGPU技术，SmolVLM现可在浏览器中实现实时网络摄像头图像识别，无需服务器支持，全部计算在用户设备上完成。这一创新不仅提升了隐私保护，还极大降低了AI应用的部署门槛。AIbase综合最新动态，深入解析SmolVLM的本地化实时演示及其对AI生态的影响。技术核心:WebGPU赋能本地化AI推理SmolVLM是一款超轻量

12GB 显存可实现 128K 上下文 5 并发会话，IBM 预览 Granite 4.0 Tiny 模型

IT之家 5 月 10 日消息，IBM 本月 2 日介绍了其 Granite 4.0 系列模型中的最小版本之一：Granite 4.0 Tiny 的预览版本。Granite 4.0 Tiny Preview 的优势在于高计算效率和低内存需求：在 FP8 精度下，运行 5 个 128KB 上下文窗口的并发对话仅需 12GB 显存，一张建议零售价 329 美元（IT之家注：现汇率约合 2383 元人

教育部长怀进鹏谈“AI 代写作业被禁”：要确保学生会用、善用、不滥用 AI

IT之家 5 月 21 日消息，据南方都市报今日报道，近期学生“代劳式”使用 AI 乃至代写作业等现象频发，引发家校担忧。在上周武汉召开的 2025 世界数字教育大会上，教育部长怀进鹏在开幕式发言中提到，要引导学生合理使用 AI，全面推动大中小学开设人工智能课程，加强人工智能教材读本等资源开发，加强技术伦理教育，确保学生会用善用、不滥用人工智能。本月中旬，教育部基础教育教学指导委员会发布《中小学

OpenAI 悄悄更新 ChatGPT，Plus / Pro 订阅用户可享全局对话内容记忆功能

感谢IT之家网友乌蝇哥的左手的线索投递！IT之家 4 月 11 日消息，OpenAI 今天发文宣布悄悄为旗下 ChatGPT 进行更新，目前订阅了 Plus 和 Pro 级别用户可以使用“经过改进的上下文记忆功能”。OpenAI 首席执行官 Sam Altman 表示，如今 ChatGPT 可以“参考用户过去的所有对话”，从而提供更个性化的体验。IT之家注意到，ChatGPT 现已支持从用

全自动按摩

智能洗头机

无人化服务

9块9的AI洗头：颠覆还是泡沫？

声明:本文来自于微信公众号定焦One（dingjiaoone），作者:梅引冬，授权站长之家转载发布。2015年，38岁的乐山井研男子陈攻科研究16年，玩坏18个头盔，最终发明出立式全自动按摩洗头机，并获得国家专利。十年后的今天，AI正在尝试给这个“旧需求”谱写“新故事”。据媒体报道，上海、深圳、福州等多地出现AI洗头店，店内配有头皮检测服务、可调节力度与水温等模式的智能洗头机、自动吹发设备或人

联想发布天禧个人超级智能体，杨元庆预告下一代 AI PC

IT之家 5 月 7 日消息，联想 Tech World 2025 创新科技大会于今日在上海世博中心举行，以“让 AI 成为创新生产力”为主题。联想集团董事长兼 CEO 杨元庆在本次大会上发表演讲，首次定义超级智能体的三大核心功能：感知与交互、认知与决策、自主与演进。杨元庆还正式发布覆盖全场景的超级智能体矩阵，包括联想天禧个人超级智能体、联想乐享企业超级智能体、联想城市超级智能体及新一代联想推理

多智能体协作

通用超级智能体

百度上线“心响”App 号称复杂任务全托管超级AI智能体

近日，百度正式发布了一款面向移动端的多智能体协作应用——心响App，其安卓版本已率先上线，iOS版本也正在紧锣密鼓地筹备上架中。这款应用以“通用超级智能体”为核心定位，致力于通过智能化手段解决用户日常生活中的复杂需求。心响App已深度整合地图类MCP功能，能够为用户提供行程自动标注、出行打车推荐等一站式服务。用户只需通过自然语言描述需求，系统即可快速规划行程，并自动推荐最佳出行方案，极大提升了出行

苹果发布FastVLM模型，可在iPhone上运行的极速视觉语言模型

苹果正式发布FastVLM，一款专为高分辨率图像处理优化的视觉语言模型（VLM），以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉编码器，实现了高达85倍的编码速度提升，为实时多模态AI应用铺平了道路。技术核心:FastViTHD编码器与高效设计FastVLM的核心在于其全新设计的FastViTHD混合视觉编码器，针对高分辨率图像处

# AI项目和框架

D-DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-DiT是什么D-DiT（Dual Diffusion Transformer）是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型，能统一图像生成和理解任务。模型结合连续图像扩散（流匹配）和离散文本扩散（掩码扩散），基于双向注意力机制同时训练图像和文本模态。D-DiT能实现文本到图像生成和图像到文本生成的双向任务，支持视觉问答、图像描述生成等多种应用。模型基于多模态扩散T

阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

IT之家 5 月 1 日消息，阿里巴巴持续发力 AI 领域，其 Qwen 团队于 3 月发布 Qwen2.5-Omni-7B 模型后，昨日（4 月 30 日）再次发布 Qwen2.5-Omni-3B，目前可以在 Hugging Face 上开放下载。IT之家注：这款 3B 参数模型是其 7B 旗舰多模态模型的轻量版本，专为消费级硬件设计，覆盖文本、音频、图像和视频等多种输入功能。团队表示，尽管参

OpenAI 悄悄上线 OpenAI 学院，免费提供 AI 教育资源

今日，人工智能领域的领军企业 OpenAI 在未进行大规模宣传的情况下，悄然推出了一个全新的教育平台——OpenAI 学院（OpenAI Academy）。这一举措被视为 OpenAI 在推动人工智能教育普及和技能培训方面迈出的重要一步，旨在为全球用户提供免费、高质量的学习资源。根据最新消息，OpenAI 学院现已上线，并提供包括视频课程和活动在内的丰富内容，涵盖从人工智能基础知识到高级技能的广泛

沉浸式体验

谷歌I/O2025展望:Material3、Android XR与生成式AI重塑开发者体验

在今天上午的谷歌I/O2025会议上，谷歌宣布了一系列令人激动的新技术，进一步展示了其在人工智能、沉浸式体验和开发工具方面的最新进展。以下是我们可以期待的主要亮点:1. Material3Expressive:情感化设计的未来谷歌将在此次大会上推出Material3Expressive，这一全新设计系统被形容为“谷歌用户体验设计的未来”。Material3Expressive注重情感化设计，融合了