清华大学与面壁智能发布端侧GUI Agent:AgentCPM-GUI 145 0 近日,清华大学THUNLP实验室联合面壁智能推出了一款创新的端侧GUI Agent——**AgentCPM-GUI**,为移动设备的人机交互带来全新突破。该智能体基于**MiniCPM-V**模型构建,总参数量仅**8B**,以手机屏幕图像为输入,支持中英文操作,可自动执行用户提出的任务,展现出强大的GUI元素定位能力。AgentCPM-GUI覆盖了包括**高德地图**、**大众点评**、**B站
vivo发布 “蓝极星计划”,全球招募顶尖博士,薪资无上限 145 0 在激烈的人才争夺战中,vivo 近日宣布启动一项名为 “蓝极星” 的全球人才招募计划,重点面向芯片、人工智能大模型等高科技领域。该计划旨在吸引全球顶尖的博士生,进一步推动 vivo 在技术研发上的创新。“蓝极星计划” 被视为 vivo 的核心人才战略,计划招募约100名专家。这些岗位涵盖了多个技术领域,包括虚拟现实(XR)、人工智能大模型、影像处理、芯片设计以及器件开发等。为了满足顶尖人才的需求,
Gmail 新功能上线:Gemini AI 助力轻松管理日历事件 145 0 在2025年的 I/O 开发者大会上,谷歌宣布其移动邮件应用 Gmail 将全面整合 Gemini AI 功能,为用户带来更便捷的日历管理体验。无论是 Android 还是 iOS 平台,用户都可以通过 Gmail 应用轻松创建、删除和编辑日历事件,并查看每日日程概览。据悉,这一新功能允许用户在 Gmail 内直接管理日历,无需切换到其他应用。用户只需点击 Gmail 应用中的 “Ask Gemi
马斯克 OpenAI 人工智能 法律纠纷 OpenAI 反诉马斯克,指责他想当 “AGI独裁者”! 145 0 法庭文件称,马斯克必须停止对 OpenAI “无休止” 的攻击。站长之家(ChinaZ.com) 4月11日 消息:昨日,OpenAI 反诉埃隆・马斯克,指责马斯克故意选在特定时机,以“虚假报价”为幌子,企图较大程度地扰乱、甚至可能吓跑那些诚心投标的投资者。OpenAI 抨击马斯克想当成为 “通用人工智能独裁者”,并表示,如果马斯克多年来 “无休止” 的 “骚扰” 行动不被制止,他最终可能真的
SmolVLM登场!WebGPU驱动实时网络摄像头AI,零服务器、本地运行,点开网页秒体验! 145 0 Hugging Face推出的SmolVLM多模态模型迎来重大突破:通过WebGPU技术,SmolVLM现可在浏览器中实现实时网络摄像头图像识别,无需服务器支持,全部计算在用户设备上完成。这一创新不仅提升了隐私保护,还极大降低了AI应用的部署门槛。AIbase综合最新动态,深入解析SmolVLM的本地化实时演示及其对AI生态的影响。技术核心:WebGPU赋能本地化AI推理SmolVLM是一款超轻量
12GB 显存可实现 128K 上下文 5 并发会话,IBM 预览 Granite 4.0 Tiny 模型 145 0 IT之家 5 月 10 日消息,IBM 本月 2 日介绍了其 Granite 4.0 系列模型中的最小版本之一:Granite 4.0 Tiny 的预览版本。Granite 4.0 Tiny Preview 的优势在于高计算效率和低内存需求:在 FP8 精度下,运行 5 个 128KB 上下文窗口的并发对话仅需 12GB 显存,一张建议零售价 329 美元(IT之家注:现汇率约合 2383 元人
教育部长怀进鹏谈“AI 代写作业被禁”:要确保学生会用、善用、不滥用 AI 145 0 IT之家 5 月 21 日消息,据南方都市报今日报道,近期学生“代劳式”使用 AI 乃至代写作业等现象频发,引发家校担忧。在上周武汉召开的 2025 世界数字教育大会上,教育部长怀进鹏在开幕式发言中提到,要引导学生合理使用 AI,全面推动大中小学开设人工智能课程,加强人工智能教材读本等资源开发,加强技术伦理教育,确保学生会用善用、不滥用人工智能。本月中旬,教育部基础教育教学指导委员会发布《中小学
OpenAI 悄悄更新 ChatGPT,Plus / Pro 订阅用户可享全局对话内容记忆功能 145 0 感谢IT之家网友 乌蝇哥的左手 的线索投递!IT之家 4 月 11 日消息,OpenAI 今天发文宣布悄悄为旗下 ChatGPT 进行更新,目前订阅了 Plus 和 Pro 级别用户可以使用“经过改进的上下文记忆功能”。OpenAI 首席执行官 Sam Altman 表示,如今 ChatGPT 可以“参考用户过去的所有对话”,从而提供更个性化的体验。IT之家注意到,ChatGPT 现已支持从用
AI洗头 全自动按摩 智能洗头机 无人化服务 9块9的AI洗头:颠覆还是泡沫? 145 0 声明:本文来自于微信公众号定焦One(dingjiaoone),作者:梅引冬,授权站长之家转载发布。2015年,38岁的乐山井研男子陈攻科研究16年,玩坏18个头盔,最终发明出立式全自动按摩洗头机,并获得国家专利。十年后的今天,AI正在尝试给这个“旧需求”谱写“新故事”。据媒体报道,上海、深圳、福州等多地出现AI洗头店,店内配有头皮检测服务、可调节力度与水温等模式的智能洗头机、自动吹发设备或人
联想发布天禧个人超级智能体,杨元庆预告下一代 AI PC 145 0 IT之家 5 月 7 日消息,联想 Tech World 2025 创新科技大会于今日在上海世博中心举行,以“让 AI 成为创新生产力”为主题。联想集团董事长兼 CEO 杨元庆在本次大会上发表演讲,首次定义超级智能体的三大核心功能:感知与交互、认知与决策、自主与演进。杨元庆还正式发布覆盖全场景的超级智能体矩阵,包括联想天禧个人超级智能体、联想乐享企业超级智能体、联想城市超级智能体及新一代联想推理
心响App 多智能体协作 通用超级智能体 MCP 百度上线“心响”App 号称复杂任务全托管超级AI智能体 145 0 近日,百度正式发布了一款面向移动端的多智能体协作应用——心响App,其安卓版本已率先上线,iOS版本也正在紧锣密鼓地筹备上架中。这款应用以“通用超级智能体”为核心定位,致力于通过智能化手段解决用户日常生活中的复杂需求。心响App已深度整合地图类MCP功能,能够为用户提供行程自动标注、出行打车推荐等一站式服务。用户只需通过自然语言描述需求,系统即可快速规划行程,并自动推荐最佳出行方案,极大提升了出行
苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型 145 0 苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉编码器,实现了高达85倍的编码速度提升,为实时多模态AI应用铺平了道路。技术核心:FastViTHD编码器与高效设计FastVLM的核心在于其全新设计的FastViTHD混合视觉编码器,针对高分辨率图像处
# AI工具 # AI项目和框架 D-DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型 144 0 D-DiT是什么D-DiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。模型结合连续图像扩散(流匹配)和离散文本扩散(掩码扩散),基于双向注意力机制同时训练图像和文本模态。D-DiT能实现文本到图像生成和图像到文本生成的双向任务,支持视觉问答、图像描述生成等多种应用。模型基于多模态扩散T
阿里通义千问 2.5-Omni-3B AI 全模态登场:7B 版 90% 性能,显存占用减少 53% 144 0 IT之家 5 月 1 日消息,阿里巴巴持续发力 AI 领域,其 Qwen 团队于 3 月发布 Qwen2.5-Omni-7B 模型后,昨日(4 月 30 日)再次发布 Qwen2.5-Omni-3B,目前可以在 Hugging Face 上开放下载。IT之家注:这款 3B 参数模型是其 7B 旗舰多模态模型的轻量版本,专为消费级硬件设计,覆盖文本、音频、图像和视频等多种输入功能。团队表示,尽管参
OpenAI学院 OpenAI AI教育 人工智能 OpenAI 悄悄上线 OpenAI 学院,免费提供 AI 教育资源 144 0 今日,人工智能领域的领军企业 OpenAI 在未进行大规模宣传的情况下,悄然推出了一个全新的教育平台——OpenAI 学院(OpenAI Academy)。这一举措被视为 OpenAI 在推动人工智能教育普及和技能培训方面迈出的重要一步,旨在为全球用户提供免费、高质量的学习资源。根据最新消息,OpenAI 学院现已上线,并提供包括视频课程和活动在内的丰富内容,涵盖从人工智能基础知识到高级技能的广泛
谷歌I/O2025 人工智能 沉浸式体验 谷歌 谷歌I/O2025展望:Material3、Android XR与生成式AI重塑开发者体验 144 0 在今天上午的谷歌I/O2025会议上,谷歌宣布了一系列令人激动的新技术,进一步展示了其在人工智能、沉浸式体验和开发工具方面的最新进展。以下是我们可以期待的主要亮点:1. Material3Expressive:情感化设计的未来谷歌将在此次大会上推出Material3Expressive,这一全新设计系统被形容为“谷歌用户体验设计的未来”。Material3Expressive注重情感化设计,融合了