Epoch AI 预言:最快 1 年内,推理模型步伐将放缓 79 0 IT之家 5 月 14 日消息,非营利 AI 研究机构 Epoch AI 最新发布报告,指出 AI 企业难以从推理模型中,持续榨取巨大性能收益,最快在一年内,推理模型的进步将放缓。报告基于公开数据和假设,强调了计算资源的限制和研究开销的增加。AI 行业长期依赖这些模型来提升基准表现,但这种依赖性正面临挑战。该机构分析师 Josh You 指出推理模型的兴起,源于其在特定任务上的出色表现。例如,O
微软高管乐观预测:未来每个人都可以是“AI 员工”的领导 79 0 IT之家 4 月 28 日消息,据英国《卫报》4 月 25 日报道,微软为志在高管职位的人们带来了好消息:未来,人人都将成为 AI 员工的上司。微软预测,未来企业将出现一种全新形态 —— 即所谓的“前沿企业”,由人类员工指挥自主运行的智能体完成各类任务。微软高管 Jared Spataro 在博客中表示:“随着智能体逐步进入职场,它们的人类‘上司’将随之崛起。他们将建设、指挥并管理智能体,扩大自
人工智能 MCP AI集成 模型上下文协议 MCP带来的突破是什么?找MCP教程看AIbase就够了 79 0 在人工智能(AI)快速发展的当下,AI 应用与现有服务和系统的深度融合成为关键需求。然而,过去这一直是个难题,各种 AI 模型与服务之间缺乏统一的集成标准,导致开发复杂度高、效率低下。如今,MCP(模型上下文协议)的出现如同一缕曙光,为这一困境带来了前所未有的突破,它正在重塑 AI 应用的开发与集成生态。打破集成壁垒,构建无缝连接的新桥梁在 MCP 出现之前,AI 应用大多孤立存在,与用户已有
AI旅游规划 飞猪问一问 AI交互式预订 个性化旅行方案 飞猪AI横空出世!旅行规划不再难,轻松搞定机酒预订 79 0 随着五一假期的临近,旅游话题再次引起关注。而飞猪推出的 AI 产品 “问一问” 近期在小红书上引起热议,甚至出现了黄牛倒卖邀请码的现象。这款看似普通的聊天助手,实际上具备强大的功能,让用户能够快速完成机票和酒店的预订,从而实现 “所见即所得” 的理想旅行规划体验。不同于以往的旅行 AI,飞猪的 “问一问” 不仅能够提供交互式的交流,还能在短时间内完成从交流到交易的闭环。用户只需输入一段话,AI 就
文本转语音(TTS)模型 Dia NariLabs 16亿参数 颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持,媲美真人对话 79 0 一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体
HailuoImage CharacterReference AI图像生成 MiniMax 海螺推出图像人物参考功能 允许用户基于单张图像生成多角度、动态姿势的角色图像 79 0 MiniMax旗下的Hailuo AI正式推出Hailuo Image全新功能——Character Reference,为AI图像生成领域带来突破性创新。据AIbase了解,该功能允许用户基于单张参考图像生成具有多角度、动态姿势、丰富表情的角色图像,支持电影化光影与构图,并提供全面的提示词控制。社区对这一功能的发布反响热烈,项目详情已通过Hailuo官网与GitHub公开,标志着Hailuo在角
AIGC短剧 短视频创作 新媒体文化 网络娱乐 可灵vs即梦,决战AI短剧 79 0 声明:本文来自于微信公众号壹娱观察,作者:大娱乐家,授权站长之家转载发布。“阴曹地府外卖员”、“怀孕生子男人鱼”、“猫哥捡个田螺姑娘”……这些看着前言不搭后语的视频,可以说是现在抖音、快手上个人创作者对AIGC短剧最常见的创作类型。抛开技术表现不谈,看到这类“创作”,也不难理解为何如今的AI短剧,即便是专业人士下场,也几乎清一色都是各种玄幻、科幻甚至尺度较大的高概念类型。或许不是平台本身的本意
MCP Function Calling AI MCP协议和Function Calling 、 AI Agents的区别是什么?MCP优势有哪些 79 0 MCP(模型上下文协议)、Function Calling 和 AI Agents 是三种重要的技术手段,它们在实现 AI 模型与外部系统交互方面各有特点。本文将详细对比这三种技术,并深入探讨 MCP 的多项显著优势。MCP、Function Calling 和 AI Agents 的区别Function Calling:平台依赖的函数调用机制Function Calling 是一种 AI 模
OpenAI 宣布 ChatGPT 自 4 月 30 日起停用 GPT-4 模型,全面升级至 4o 版本 79 0 感谢IT之家网友 GreatMOLA 的线索投递!IT之家 4 月 11 日消息,OpenAI 宣布 GPT-4 将于 4 月 30 日从 ChatGPT 中移除,但仍可在 API 中使用。OpenAI 表示,GPT-4 退役后完全由新型原生多模态模型 GPT-4o 取代。根据官方评估报告,GPT-4o 在写作质量、编程辅助、STEM 领域全面超越 GPT-4 模型,而且最近又进一步升级改善了
Vidi 多模态模型 时间检索 字节跳动 字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流 79 0 字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模
gpt-image-1 ChatGPT AI图像生成 OpenAI OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能 80 0 OpenAI 在近日宣布,已将其最新的图像生成功能通过 API 开放给开发者,使其能够将这一先进的技术集成到各种应用和服务中。这一消息无疑为开发者们提供了一个新的机遇,特别是在图像处理和创作领域。新推出的图像生成模型名为 “gpt-image-1”,其背后支持了 ChatGPT 的图像生成技术。自今年3月底该功能上线以来,用户可以创建出逼真的吉卜力风格图片和各种 “AI 人偶”。这一功能在上线后迅
ChatGPT GPT-4 图像生成 OpenAI ChatGPT 借 “吉卜力热潮” 迅速攀升,付费用户数突破 2000 万 80 0 近日,ChatGPT 凭借其全新的图像生成功能,迎来了一波前所未有的用户增长,成为互联网热议的焦点。根据 SensorTower 的数据,上周该应用的活跃用户数、应用内订阅收入和下载量均创下历史新高,标志着其在市场上的强劲表现。自 GPT-4o 上线以来,ChatGPT 吸引了大量用户使用其图像生成工具,将生活中的名场面和日常照片转变为日本吉卜力动画工作室风格的画作。这样的创意吸引了包括白宫在内的
上市价 99 元 → 今日 70 元:小米米家多功能便携手电筒京东国补新低 80 0 小米・米家多功能便携手电筒 10 月 11 日开售,该款手电筒拥有 1000 流明亮度,配备 3100mAh 电池,售价 99 元。京东今日活动价为 89 元,按下方步骤下单,叠加 85 折国补后,实付 70.64 元即可入手:点击下方卡片加购物车 1 件;打开微信小程序“京东购物”,1.68 元开通“省钱卡”可得 25-5 元无门槛全品类券:点此购券;在小程序中直接进入购物车,PLUS 会员立
负责任AI 知识产权 维基百科 媒体联盟 AI爬虫如狼似虎,维基百科已经选择认怂 80 0 声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权站长之家转载发布。本月初,代表全美2200多家新闻机构的新闻/媒体联盟(News/Media Alliance)发起“支持负责任AI”运动,呼吁监管机构强制科技巨头为AI产品使用的内容付费。但就在美国媒体抱团保卫自己的知识产权时,单打独斗的维基百科则宣布向AI厂商“投降”。运营维基百科的维基媒体基金会(Wiki
68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩 80 0 大模型竞技场的可信度,再次被锤。最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。它指出,如今被视为 LLM 领域首选排行榜的 Chatbot Arena,存在诸多系统问题。比如:少数大厂可以私下测试多个模型版本,Llama4 在发布前甚至测了 27 个版本,然后只公开最佳表现。数据访问不平等,专有模型获得的用户反馈数据显著多于开源模型。试用
谷歌“AI 笔记神器”NotebookLM 将推出移动端 App,5 月 20 日上线 80 0 IT之家 5 月 3 日消息,应用商店页面显示,谷歌的 NotebookLM 安卓和 iOS 应用预计将在 5 月 20 日正式上线,目前已可预购。NotebookLM 是谷歌的 AI 笔记和研究助手,2023 年推出以来仅支持桌面端使用。谷歌现在正计划将其推广至移动端,方便用户随时随地使用。据 TechCrunch 报道,NotebookLM 主要帮助学生、职场人士和研究人员通过智能摘要等功能