Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合 88 0 Runway于近日正式推出Gen-4References功能,为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像,提取人物、场景或风格特征,并在生成内容中保持高度一致性,支持多张图像混合生成,为AI视频创作带来了前所未有的控制力与创意自由。核心功能解析:多图像融合与一致性控制Gen-4References的核心在于其强大的图像参考与风格嵌入能力。用户可上传1至
Claude 移动应用即将推出语音模式,支持多种声音选项 100 0 Anthropic 的 Claude 移动应用即将迎来一次重要升级,新增的语音模式功能备受期待。据 TestingCatalog 周日的报道,Claude 的语音模式将采用推按式对话方式,并且支持多种声音选项。在语音模式下,Claude 不仅可以进行语音对话,还具备了网页搜索的能力。用户在使用时,搜索结果将以列出来源的方式呈现,类似于其桌面版本。输出结果会被整理成要点,使得用户更容易理解和跟进。同
Cursor母公司Anysphere完成9亿美元融资,估值飙升至90亿美元 144 0 AI编程助手Cursor的母公司Anysphere于今日宣布完成一轮高达9亿美元的融资,估值达到惊人的90亿美元。此次融资由Thrive Capital领投,知名投资机构Andreessen Horowitz(a16z)和Accel共同参与。据悉,Anysphere在今年4月1日刚刚完成上一轮融资,短短数月内估值暴涨,彰显了市场对AI编程工具的强烈信心与期待。Cursor:重塑编程体验的AI利器A
Excel MCP Server上线 可通过Claude等客户端直接操作Excel文件 191 0 一款名为Excel MCP Server的开源工具近日引发热议。这款基于**模型上下文协议(Model Context Protocol, MCP)**开发的服务器,允许用户通过AI助手直接操作Excel文件,无需安装微软Excel软件即可实现高效的表格处理。GitHub项目地址为:https://top.aibase.com/tool/excel-mcp-server据悉,该工具通过AI客户端如
未来两年,AI Agent 部署将增长 327% 79 0 据最新的 Salesforce 全球调研显示,全球人力资源高管(CHRO)计划在未来两年内大幅扩展数字劳动力,特别是人工智能(AI)代理的部署,以提升生产力。这项研究对200名全球人力资源高管进行了调查,结果显示,他们一致认为 AI 代理将深刻改变组织结构。图源备注:图片由AI生成,图片授权服务商Midjourney调研结果指出,77% 的受访者相信,AI 代理将成为未来劳动力的重要组成部分。这一
KREA AI携手ChatGPT推出视觉提示编辑功能,释放图像创作新潜能 98 0 KREA AI近日推出了一项令人振奋的功能更新,通过集成OpenAI的GPT图像API,用户可利用编辑标记、基本形状、注释和参考图像,以视觉方式提示ChatGPT进行快速图像编辑。这一创新功能极大提升了图像创作的灵活性和互动性,为用户带来了前所未有的创作体验。AIbase观察到,此功能不仅展示了KREA AI在生成式AI领域的技术实力,也凸显了API在创意应用中的无限可能。核心功能解析:直观高效的
Suno v4.5 正式上线,仅限付费用户使用,生成歌曲延长至8分钟 197 0 人工智能音乐生成平台 Suno 近日正式推出其最新模型 v4.5,为音乐创作领域再添创新动力。根据 Suno 官方公告,v4.5在音质、风格多样性和用户体验上实现了显著突破,但新版本目前仅对 Pro 和 Premier 付费用户开放使用。v4.5核心升级:更丰富的音效与创作自由度Suno v4.5作为 v4系列的优化版本,带来了多项令人瞩目的技术进步。根据官方介绍,v4.5在以下方面表现尤为突出:
Waymo 计划到2026年增加2000辆机器人出租车,打造未来出行新体验 63 0 在自动驾驶技术日益成熟的背景下,Waymo 近日宣布了一项激动人心的扩张计划。该公司表示,最近已完成最后一批捷豹 I-Pace SUV 的交付,这些车辆将在亚利桑那州的工厂进行传感器和自动驾驶技术的改造,加入其机器人出租车车队。根据 Waymo 的最新消息,目前在旧金山、洛杉矶、凤凰城和奥斯汀等主要市场中,已有1500辆捷豹 I-Pace 投入运营。Waymo 计划到2026年再增加2000辆机器
阿联酋从幼儿园起普及人工智能课程,全球应效仿 137 0 阿联酋近日宣布了一项全国性计划,将人工智能(AI)作为所有学生从幼儿园到高中必修的课程。该政策将在2025-2026学年正式实施,届时所有公立学校都将把 AI 课程纳入核心教学体系。阿联酋官员表示,私人学校也可能会在国家指导下跟进这一政策,旨在为年轻一代做好迎接科技驱动未来的准备,增强他们的 AI 技能,巩固阿联酋在区域内的 AI 和数字创新领导地位。图源备注:图片由AI生成,图片授权服务商Mid
ChatGPT 访问量激增,4 月总计达47.86亿次、首次超越 X 200 0 根据权威数据分析平台 Similarweb 最新发布的2025年4月网站流量报告,OpenAI 旗下的人工智能聊天工具 ChatGPT 在全球范围内的访问量实现了历史性突破,总计达到47.86亿次,首次超过社交媒体平台 X 的40.28亿次。这一里程碑不仅凸显了 ChatGPT 的迅猛增长势头,也标志着生成式 AI 工具在全球用户中的普及度正在快速攀升。ChatGPT 流量持续攀升,展现“工作性”
Visa 推出智能商务平台,让 AI 安全购物变为现实 80 0 Visa 日前在旧金山的全球产品发布会上推出了一项名为 “Visa 智能商务” 的新平台,旨在让人工智能助手能够代表用户进行购物,这意味着 AI 将可以安全地访问用户的信用卡。Visa 的首席产品与战略官 Jack Forestell 在发布会上表示:“很快,AI 助手将能够浏览、选择、购买和管理商品。”这一平台的推出是 Visa 与多家领先 AI 公司的合作成果,包括 Anthropic、IBM
11x 创始人辞去首席执行官职务,Prabhav Jain 接任 169 0 11x 的创始人 Hasan Sukkar 于今晨在 LinkedIn 上宣布,他将辞去首席执行官(CEO)的职务,现任首席技术官(CTO)Prabhav Jain 将接任这一职位。Sukkar 将转为 “非执行董事长”,继续与 Jain 合作,专注于公司的战略方向、产品愿景、行业关系以及开拓新的市场机会。图源备注:图片由AI生成,图片授权服务商MidjourneySukkar 在 LinkedI
谷歌Gemini聊天机器人全新升级:支持多图上传和图像编辑功能 193 0 近日,谷歌的 Gemini 聊天机器人迎来了重要更新,新增了多图上传功能,这一功能目前已经向部分用户开放。以往,用户只能上传单张图片,但现在在 Gemini2.0Flash 模型的支持下,部分用户已经能够在网页端同时上传多张图片。值得注意的是,该功能尚不支持免费账户,且在某些付费高级账户中也没有完全开放。这种分阶段推出的策略可能是为了逐步评估用户的反馈。除了多图上传,谷歌还在更新中加入了 AI 图
魅族Note16 Flyme AIOS2 智能助手Aicy 魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni 130 0 站长之家(ChinaZ.com) 5月6日 消息:今日,星纪魅族正式宣布将于5月13日举办新品发布会,推出魅族Note16系列手机及Flyme AIOS2操作系统。据官方透露,此次升级的Flyme AIOS2系统在智能交互与性能优化方面实现多项突破。Flyme AIOS2系统引入全新设计的智能助手Aicy,其界面设计更具呼吸感与动态效果,同时搭载升级后的思考引擎,可实现更精准的语义理解和场景响
人工智能 语音识别 开源软件 开发者工具 AI日报:苹果AI国行版或随iOS 18.6月底上线;Suno v4.5正式上线;Runway发布图像一致性参考功能 179 0 欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2,语音转录能力再提升英伟达推出的Parakeet-TDT-0.6B-V2模型在自动语音识别领域取得了显
通义千问 开源模型 大模型测评 AI技术 上线仅7天!阿里通义千问3强势登顶全球开源模型宝座 182 0 快科技5月6日消息,近日,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称千问3”)斩获全球开源模型冠军。同时,千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,位列全球第一。据了解,LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆联合纽约大学等机构推