全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

Sakana AI 扔出重磅炸弹：让机器像人一样“持续思考”

人工智能领域最近迎来了一项引人关注的新进展。总部位于东京的 Sakana AI 发表了一篇题为《连续思维机器》（Continuous Thought Machines）的论文，提出了一种旨在让机器模拟生物大脑复杂神经活动和“持续思考”能力的新模型。这篇论文的核心观点是挑战当前深度学习中对时间动态的简化处理，试图将神经元层面的时序处理和同步机制重新引入，使“神经时序”成为人工智能模型的基础。当前主流

AI 突围！阿里云与 DeepSeek 脱颖而出，福布斯发布中国人工智能企业 TOP 50 榜单

2025年5月11日，福布斯发布了中国人工智能科技企业 TOP50评选名单，标志着中国在全球人工智能领域的持续崛起。随着技术爆发与场景落地的双重加速，中国的人工智能产业正在快速扩张，预计未来五年市场规模将以超30% 的年复合增长率增长。据工业和信息化部最新数据显示，中国目前已有超过4，500家人工智能企业，涵盖了从基础算力到行业应用的各个领域。这些企业在智能制造、智慧医疗、自动驾驶等20多个领域中

新一代开源视觉编码器 OpenVision 发布：超越 CLIP 与 SigLIP 的强大选择

加州大学圣克鲁兹分校近日宣布推出 OpenVision，这是一个全新的视觉编码器系列，旨在为 OpenAI 的 CLIP 和谷歌的 SigLIP 等模型提供替代方案。OpenVision 的发布为开发者和企业带来了更多灵活性和选择，使得图像处理和理解变得更加高效。什么是视觉编码器?视觉编码器是一种人工智能模型，它将视觉材料（通常是上传的静态图像）转化为可被其他非视觉模型(如大型语言模型)理解的数值

微软终止Bing Search API:开发者需在2025年前寻找替代方案

微软已正式宣布，将于2025年8月11日终止其公共Bing Search API服务，包括Search v7和Custom Search在内的所有版本。此决定将影响从免费用户到付费用户的所有服务使用者。根据微软发布的退休通知，终止日期后，所有现有API资源将被禁用，同时新用户注册通道也将关闭。微软已在Bing Web Search API页面上发布了醒目横幅，提醒用户注意这一截止日期，并强调新部署

从图像出发构建可控交互世界！昆仑万维正式开源Matrix-Game

5月13日，昆仑万维集团宣布正式开源Matrix-Game大模型，这是一款专注于交互式世界生成的先进模型，标志着交互式世界生成技术的新突破。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地，也是工业界首个开源的10B+空间智能大模型，专为开放式环境中的高质量生成与精确控制而设计。这一开源举措不仅刷新了交互式世界生成的技术上限，也为构建通用虚拟世界基座树立了全新标杆。Matri

ChatGPT 推出 SharePoint 连接器，企业数据分析更高效！

根据最新消息，ChatGPT 现在推出了一项新的功能，允许用户通过 SharePoint 连接器访问公司数据。这一功能目前处于测试阶段，面向 ChatGPT Plus、Pro 和 Team 用户开放。通过这一集成，ChatGPT 能够从多个 SharePoint 站点中分析和总结内容，并附带来源引用。OpenAI 表示，这一新功能可以用于多种场景，比如跨部门总结战略文件，或通过将内部数据与网络信息

AI搜索初创公司Perplexity 即将完成5亿美元融资，估值达140亿美元

人工智能搜索初创公司 Perplexity 正在接近其六个月内的第二次融资，估值达到140亿美元。这一轮融资将由风险投资公司 Accel 领投，预计金额将达到5亿美元。Perplexity 以其先进的人工智能搜索技术受到市场的广泛关注，正逐渐成为行业内的一匹黑马。图源备注:图片由AI生成，图片授权服务商MidjourneyPerplexity 成立于不久前，但凭借其创新的技术和市场定位，吸引了大量

AI开发更轻松!MCPHub简化MCP服务器接入，支持OpenAI、LangChain等

为进一步简化 AI 服务中的 Model Context Protocol（MCP）服务器集成流程，MCPHub 正式发布。作为一款可嵌入式解决方案，MCPHub 为开发者提供了统一的配置、管理与连接方式，兼容多种主流 AI 框架，包括 OpenAI Agents、LangChain 和 Autogen。在当前多模型、多框架并行演进的背景下，MCPHub 致力于打破服务集成复杂、部署门槛高的问题，

阿里MNN神更新！移动端开源多模态AI支持Qwen-2.5，文本图像语音全搞定！

阿里巴巴开源项目MNN（Mobile Neural Network）发布了其移动端多模态大模型应用MnnLlmApp的最新版本，新增对Qwen-2.5-Omni-3B和7B模型的支持。这款完全开源、运行于移动端本地的大模型应用，支持文本到文本、图像到文本、音频到文本和文本到图像生成等多种模态任务，以其高效性能和低资源占用引发开发者广泛关注。AIbase观察到，MNN的此次更新进一步推动了多模态AI

月之暗面Kimi界面升级：气泡样式优化改为无边界内容展示

月之暗面科技有限公司旗下的智能助手Kimi宣布对其产品界面进行了一次重大升级。此次升级的核心目标是打破传统对话框的限制，将Kimi从一个简单的聊天工具转变为一个功能更强大、信息呈现更丰富的多模态容器。Kimi的界面重构包括了多项重要更新。首先，信息呈现能力得到了显著增强。Kimi现在支持多端实时K线图组件，能够响应股票和指数类查询，为用户提供直观的市场走势分析。此外，Web端新增了HTML预览功能

字节跳动发布统一图像定制框架DreamO：集成换装、换脸与风格迁移

字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO，这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能，为AI图像编辑领域带来了全新的技术突破。AIbase编辑部整理了最新信息，深入解析DreamO的核心亮点及其对行业的潜在影响。框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架，支持多样化的编辑任务，并通过灵活的参数设置实现

Lovart震撼发布：全球首个设计Agent，一键从创意到成品

人工智能设计领域迎来里程碑式突破!一款名为Lovart的AI设计Agent于近日正式亮相，被誉为“全球首个设计Agent”。这一产品以其从文本提示到专业视觉设计的端到端能力，引发了业内广泛关注。产品亮点:一键从创意到成品Lovart的核心在于其全链路设计能力，能够将用户的模糊创意或简单文本描述转化为像素级精度的专业设计作品。根据官方介绍，Lovart集成了图像、视频和音乐生成模型，支持从任务拆解到

AI药物研发神器DiffSMol上线！3秒生成候选药物，成功率暴涨5倍！

5月12日，俄亥俄州立大学研究团队推出DiffSMol，一款生成式人工智能模型，专为生成候选药物的3D结构设计（https://news.osu.edu）。DiffSMol通过分析已知配体(与蛋白质靶点结合的分子)的形状，仅需数秒即可生成具有优异结合特性的新型3D分子，成功率高达61.4%，远超此前研究仅12%的水平。AIbase观察到，这一突破性进展有望重塑长达十年的药物研发流程，显著提升效率与

OpenAI 与软银的百亿 AI “星际之门”计划进展缓慢，融资难题悬而未决

在人工智能领域，OpenAI 与软银共同推出的星际之门（Stargate）项目一度引起了广泛关注。该项目计划投资高达1000亿美元，目标是建立全球领先的人工智能基础设施，并希望在未来将投资额提升至5000亿美元。然而，随着时间的推移，融资进展的缓慢和市场环境的变化使得这一宏伟计划面临挑战。融资难题显现根据最新消息，由于美国政府的关税政策，星际之门项目的融资进展出现了阻碍。针对服务器机架、芯片及

OpenAI推出深度研究报告一键导出PDF功能

人工智能领域的领军企业OpenAI宣布，为其ChatGPT深度研究（Deep Research）工具新增了一项重要功能——一键将深度研究报告导出为PDF。此功能不仅提升了研究报告的实用性，还进一步推动了AI在企业场景中的落地应用。功能亮点:完整保留格式，专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合，生成包含引用、表格和图片的详尽报告。然而，此前用户需手动整理或分享这些报告，限

全球首款设计Agent Lovart内测！一句话搞定Logo、视频、品牌全套

5月12日，Lovart AI正式宣布推出全球首款设计Agent，定位为文生图领域最具创新性的产品形态。作为一款集成图像、视频和音乐模型的AI设计工具，Lovart通过自然语言指令实现从任务拆解到最终输出的全链路自动化设计，彻底颠覆传统设计工作流。AIbase观察到，Lovart的Beta测试已在全球引发热烈反响，吸引了设计师、营销团队和初创企业的广泛关注。体验地址：https://lovart.