国产MiniMax语音模型横扫国际舞台,迈入个性化语音新时代 169 0 在人工智能领域的快速发展中,国产大模型的进步速度让人惊叹。早在今年初,DeepSeek-R1以超低成本获得了超越 OpenAI 的表现,令人重新审视国外大模型的垄断地位。如今,MiniMax 再次带来了重磅消息:其全新一代文本转语音(TTS)模型 “Speech-02” 在国际权威的语音评测榜单 Artificial Analysis 上强势登顶,击败了 OpenAI 和 ElevenLabs 等
Windsurf 发布 Wave 9:SWE-1 系列模型开启软件工程新篇章 162 0 5月15日,Windsurf 宣布推出 Wave9更新,正式发布其首个人工智能模型系列 SWE-1,专为软件工程全流程优化设计。系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini 三款模型,旨在提升软件开发效率,号称可加速高达99%。据 Windsurf 内部评估,SWE-1系列性能逼近业界领先的 Frontier 模型,与 Claude3.5Sonnet、GPT-4.1等模型
Nous Research推出Psyche去中心化网络,开启全民参与AI开发新纪元 169 0 Nous Research宣布正式推出Psyche,一个基于Solana区块链的去中心化AI训练网络,旨在让全球用户通过闲置计算资源参与尖端AI模型的开发。这一平台利用DisTrO技术大幅降低带宽需求,成功启动了有史以来规模最大的互联网分布式训练,目标是训练一个40亿参数的AI模型,并将所有数据和检查点完全开源。AIbase深入剖析Psyche的核心技术与愿景,揭示其对AI民主化的深远影响。Psy
复旦携手腾讯推出说话人视频生成工具DICE-Talk,备情感表达 110 0 由复旦大学与腾讯联合研发的DICE-Talk说话人视频生成工具于近日正式发布,以其卓越的情感表达能力和逼真的人物表现引发行业热议。AIbase通过整合社交媒体最新动态及公开信息,为您深度解析这一技术突破的亮点与潜力。DICE-Talk的核心创新在于其身份-情感分离处理机制。通过将说话人的身份特征(如面部细节、肤色)与情感表达(表情、语气)解耦,DICE-Talk确保在情感变化时人物外观保持高度一致
微软纳德拉应对 AI 新挑战,DeepSeek 崛起引发战略调整 192 0 IT之家 5 月 16 日消息,彭博社昨日(5 月 15 日)发布博文,称赞了微软首席执行官萨蒂亚・纳德拉(Satya Nadella)对 AI 发展的深刻洞察,称其快速响应 Deepseek-R1 模型的崛起,积极拥抱竞争,将 R1 整合进微软云服务 Azure。今年 1 月在瑞士达沃斯举行的世界经济论坛上,纳德拉原本计划展示公司在 AI 领域的领先地位,但被 Deepseek 的 R1 推理
人工智能 MCP协议 AI交互 AI产业发展 国内MCP工具推荐:如何选择最适合你的AI开发利器? 99 0 在人工智能飞速发展的今天,AI模型与外部世界的交互能力成为了衡量其先进性的重要标准之一。而MCP(Model Context Protocol)作为一种开放标准协议,正以其卓越的性能和广泛的应用前景,引领着AI交互的未来。AIbase作为全球MCP Server集合平台(https://mcp.aibase.cn/),精心打造了“精选2025优质MCP服务器”栏目,为国内的开发者和企业提供了探
宇树科技创始人王兴兴:AI将深刻改变教育 但不会取代教师 203 0 快科技5月16日消息,据媒体报道,2025世界数字教育大会闭幕式在武汉召开。宇树科技创始人王兴兴在发言中表示,过去10年,AI技术经历了从基础识别智能到认知智能的重大突破。王兴兴表示,人工智能技术的蓬勃发展更深切影响着教育发展的格局。人工智能正在改变知识的产生与传播,为每一位学习者提供定制化的学习体验,让知识的获取愈发高效且个性化。王兴兴强调,人工智能正在引发教育领域的根本性变革:一方面通过个
广州海关自主研发,全国海关首个辐射探测“机器狗”投入使用 88 0 感谢IT之家网友 六月河 的线索投递!IT之家 5 月 16 日消息,据“海关发布”公众号消息,近日,由广州海关自主研发完成的全国海关首个辐射探测“机器狗”在佛山市珠江货运码头、北滘港等地投入使用。据介绍,这也是广州海关首次利用四足机器人参与海关监管作业。该“机器狗”具备辐射探测、场所巡查、辅助查验等多项功能,可用于辅助海关关员开展放射性货物检测等特定监管作业。IT之家注意到,机器狗在日常生活
YouTube 推出 AI 广告新利器“Peak Points”,Gemini 精准捕捉用户注意力 156 0 在纽约举行的 YouTube Brandcast 活动上,YouTube 宣布推出一项名为“Peak Points”的创新广告工具。该工具的核心技术是谷歌先进的 Gemini AI 模型,其功能在于精准识别视频内容中最能吸引观众注意力的“高光时刻”。YouTube 的目标是通过在这些关键时刻之后立即投放广告,从而显著提高广告的曝光度和点击率。据 YouTube 介绍,“Peak Points”的工
OpenAI 与 CoreWeave 达成高达 40 亿美元的云计算协议,合作再度加深 105 0 CoreWeave 公司近日与人工智能领域的领军者 OpenAI 达成了一项高达40亿美元的云计算合作协议,进一步加深了双方的合作关系。这项协议将在未来五年内执行,OpenAI 将通过这项协议在2029年前向 CoreWeave 支付该金额。此前,CoreWeave 在其财报电话会议上已披露了这一协议,但未公开合作方的具体名称,只是将其描述为一家企业级人工智能公司。在公开市场上市之前,CoreWe
美国国会拟通过禁令 阻止各州对人工智能的监管措施 178 0 近期,美国国会众议院能源与商务委员会(House E&C)提出了一项预算调解提案,其中包含一项引人关注的联邦禁令。这项禁令计划在未来十年内,禁止各州对人工智能(AI)及相关技术进行任何形式的法律或监管。这一提案已于5月14日从委员会通过,受到广泛关注。提案中的 “人工智能与信息技术现代化倡议:禁令” 条款明确规定:“任何州或其下属政治实体在法案实施之日起的十年内,不得执行任何法律或监管措施来规范人
Meta 推迟 Behemoth 发布引发内部担忧,股价一度下跌超3% 72 0 据最新报道,Meta Platforms 计划推迟其旗舰 AI 模型 Behemoth 的发布。原定于今年4月发布的 Behemoth,先是被推迟至6月,如今又预计将延迟到2025年秋季甚至更晚。这一变动引发了公司内部对于 Meta 在 AI 领域数十亿美元投资方向的担忧。Meta 的工程师们在提升 Behemoth 大型语言模型的能力时遭遇了困难,部分员工质疑相较于前代模型,Behemoth 的
ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard 196 0 人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜,于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。 用户可以通过点击按钮播放、组合、循环各种音效,或者可以通过文本提示生成全新的 AI 音效。技术亮点:文本驱动的无限音效生成SB-1Infinite Soundboard的核心在于其基于Text-to-SFX模型的音效生成能力。用
Manus推出图像生成Agent:从文字到视觉 AI任务执行新革命 171 0 人工智能领域的先锋企业Manus于宣布推出其全新图像生成Agent,进一步扩展其作为全球首个人工智能通用代理的强大功能。这一创新工具不仅能够生成高质量图像,还能理解用户意图、规划解决方案,并结合多种工具完成复杂任务。AIbase通过整合社交媒体最新动态及官方信息,为您深度解析这一技术突破的意义与潜力。技术核心:智能规划与多工具协同与传统图像生成工具不同,Manus图像生成Agent的核心在于其智能
Windsurf重磅发布SWE-1系列!首款全流程软件工程AI模型,挑战Claude 3.5,提效99%! 190 0 Windsurf(原Codeium)正式发布其首款自主研发的AI模型家族——SWE-1系列,包括SWE-1、SWE-1-lite和SWE-1-mini。这一系列模型不仅针对代码生成进行了优化,还首次聚焦整个软件工程生命周期,覆盖从编码、调试到终端操作和多工具协作的全流程。AIbase综合最新信息,深入解析SWE-1系列的技术突破及其对AI开发生态的深远影响。SWE-1系列:软件工程全流程的AI助手
Sam Altman 展望未来:让ChatGPT记住你的一切生活点滴 136 0 在近日的一场人工智能活动上,OpenAI 首席执行官 Sam Altman 分享了关于 ChatGPT 未来发展的激动人心的愿景。他提到,理想中的 ChatGPT 将能够记录用户生活中的每一个瞬间,从而提供更个性化的服务。当被问及如何让 ChatGPT 更加贴近用户时,Altman 表示希望开发出一个小型推理模型,能够整合人们的生活经历与背景信息。他设想的这个模型,能够包含用户一生中的对话记录、阅