最新

ComfyUI
ComfyUI使用指南
ComfyUI插件
人像摄影
工作流
微信首个AI助手 “元宝” 正式上线,可以添加为微信好友
微信平台推出了首个 AI 助手 ——“元宝”。用户只需在微信中搜索 “元宝”,添加为好友后,即可轻松与其进行对话。与传统的聊天机器人不同,元宝以好友的身份出现,无需下载其他应用或小程序,聊天时甚至会显示 “对方正在输入...” 的信息,带来更加真实的互动体验。元宝 AI 是腾讯最新开发的 AI 助手,搭载了混元和 DeepSeek 双模引擎,能够无缝接入微信生态。其强大的功能包括快速解析微信公众号
Anthropic即将推出Claude AI语音助手,挑战ChatGPT
据彭博社报道,人工智能公司 Anthropic 正在积极开发其聊天机器人 Claude 的新功能 —— 语音助手,预计本月内将正式发布。这一新功能将使 Claude AI 与 OpenAI 的 ChatGPT 在交互体验上展开竞争,丰富用户与 AI 的交流方式。距离 OpenAI 推出类似功能已近一年,Claude 的语音模式显然是对这一市场需求的及时回应。新语音助手将首先在 Claude 的 i
Figma与AI初创公司Lovable对决,开发者模式之争升级
近日,Figma向Lovable发出了停止令,要求该公司停止使用“开发者模式”这一术语。Figma声称,这一术语已于去年成功注册为其商标。根据美国专利商标局的记录,Figma确实在其设计工具中拥有名为“开发者模式”的功能,并且该术语已经受到了商标保护。然而,这场争议并不简单。事实上,“开发者模式”这一术语在多个软件产品中早已是常见的标准表达。苹果的iOS、谷歌的Chrome和微软的Xbox等大公司
微软 Edge 浏览器推出免费 Copilot Vision 功能,AI 助手实时解读屏幕内容
近日,微软在其 Edge 浏览器中免费上线了全新的 AI 助手功能 “Copilot Vision”。这一功能的推出为用户提供了更为智能的操作体验,让用户可以通过语音与 AI 助手进行互动,实时解读屏幕内容,帮助用户完成各项任务。根据微软人工智能首席执行官穆斯塔法・苏莱曼的介绍,Copilot Vision 是一种基于语音的助手功能。用户使用时只需启用该功能,就能够让 Copilot Vision
JetBrains 推出编码智能体 Junie AI,助力编程与调试全新体验
日前,JetBrains 公司正式宣布其全新的编码智能体 ——Junie AI,已达到 “生产就绪”(production-ready)的状态。这意味着,开发者们可以利用 Junie AI 更高效地处理编写代码和调试运行等复杂任务。Junie AI 的推出,标志着 JetBrains 在 AI 工具领域的又一重大进展。除了 Junie AI,JetBrains 还对其旧版 AI 助手进行了更新,支
OpenAI 拟以 30 亿美元收购 AI 编程工具 Windsurf
彭博社率先报道,OpenAI 正与人工智能辅助编程工具 Windsurf(前身为 Codeium)展开收购谈判,交易金额约为30亿美元。这一潜在收购将成为 OpenAI 迄今为止最大规模的并购交易,标志着其在 AI 驱动的开发者工具市场迈出重要一步。Windsurf:AI 编程领域的明星工具Windsurf 是一款广受开发者欢迎的 AI 编程助手,能够基于自然语言提示生成代码、解释现有代码并执行相
Adobe 投资英国AI视频公司 Synthesia
近日,英国初创公司 Synthesia 凭借在企业 AI 生成视频领域的杰出表现,成功获得了 Adobe 的战略投资。自成立以来,Synthesia 在 AI 视频化身技术上不断创新,目前已成为行业的领军者。据悉,Synthesia 的年度经常性收入已突破1亿美元,成为众多企业视频解决方案的首选。目前,全球已有超过6万家公司使用 Synthesia 的服务,其中70% 以上是财富100强企业。每天
OpenAI 发布全新人工智能模型,实现 “图像思考” 能力
OpenAI 最近推出了其最新的人工智能模型,名为 o3。这款模型标志着 AI 在理解和分析图像方面的一次重大进步,尤其是在处理低质量草图和图表方面。与此同时,OpenAI 还发布了一个较小的版本 o4-mini,进一步丰富了其产品线。o3模型的核心功能在于能够 “用图像思考”,这意味着用户可以上传各种图像,如白板草图和复杂的图表,让 AI 进行深入分析和讨论。这一进展使得 AI 不仅仅停留在文本
谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验
近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。Gemini Live 功能的强大之处在于它能够实时识别用户手机摄像头和屏幕
微信上线元宝AI好友功能,强化超级应用生态对竞争对手形成新挑战
微信于2025年4月16日正式推出元宝AI好友功能,允许用户将腾讯自研的AI助手元宝添加为微信联系人,直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性,也对其他AI聊天服务和小程序构成显著竞争压力。以下是AIbase对元宝AI好友功能的深度解析,探讨其技术亮点、用户体验及对行业的潜在影响。元宝AI好友上线:无缝融入微信生态元宝是腾讯基于其混元(Hunyuan)大语言模型开发的
OpenAI 推出全新推理模型 o3,实现图像思考能力
OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。这次发布的 o3和 o4-mini 模型在多模态处理上表现出色,具备了图像处理、网页搜索和代码执行等功能。
OpenAI发布两款多模态推理模型o4-mini、满血版o3
在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。OpenAI公布的测试数据显示,o4-mini表现卓越。在AIME2024和2025测试中,其准确率分别达到93.4%和92.7%,甚至超越
月之暗面Kimi开源数学定理证明模型Kimina-Prover
Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
OpenAI 正式发布了其最新开源项目 Codex CLI,这是一款轻量级的代码智能体工具。该工具的发布迅速引起了极大的关注,仅在短短5小时内,Codex CLI 便突破了5000颗星的评价,预计今天有望突破1万颗星,迅速成为 Github 上的一颗新星。OpenAI 的联合创始人兼总裁 Greg Brockman 表示,Codex CLI 只是他们代码工具系列的第一款,未来将继续推出更多的智能体
义乌商城集团接入阿里通义大模型 将打造“AI智能经营助手”
义乌商城集团宣布正式接入阿里通义大模型,结合阿里巴巴在云计算、大数据和电商等领域的优势,帮助210万中小商家利用 AI 技术实现精准经营并快速拓展海外市场。此次合作标志着义乌商城集团在数字化转型和全球化布局方面迈出了重要一步,也展现了阿里巴巴在推动中小企业数字化转型中的重要作用。义乌商城集团旗下的 Chinagoods 平台覆盖超过1200万种产品,服务7.5万家实体商铺及210万家中小微企业。通
上海人工智能实验室开源小语种多模态数据集万卷·丝路2.0
由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文本、图片、音频、视频四大模态,数据总量超过1150万条,音视频时长超过2.6万小时,成为小语种多模态领域的重要资源。“万卷·丝路2.0”具有多语言、大规模、多模态、高质量的特点。它不仅扩充了语种数量,