微信,OpenAI和Kimi想一起去了:大模型的尽头依然还是社交平台

声明:本文来自于微信公众号硅星genai,作者:周一笑,授权站长之家转载发布。AI圈最近弥漫着一股微妙的气息。人们似乎不再热议大语言模型的最新突破、以及AI应用的无限可能时,一些代表着未来的AI巨头,却似乎正将目光投向互联网那熟悉得不能再熟悉的角落——社交网络与社区。近期的传闻和动作颇具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,据称正内部测试类X的社交功能,其CEO

AI日报:阿里通义万相首尾帧生视频模型;豆包开源Seed智能体模型UI-TARS-1.5;OpenAI首发“智能体实践指南”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源阿里巴巴的通义实验室在Hugging Face和GitHub上开源了Wan2.1-FLF2V-14B模型,标志

聚智2025,AI重塑未来格局——2025人工智能论坛圆满落幕

这场行业盛会云集了 200 余位国内外先进学者、行业领军人物,以大模型创新、人工智能前沿应用、AI哲学与伦理、数学科学交叉融合等热门议题为核心,展开多轮深度研讨与思维碰撞。论坛通过线上线下联动的形式,吸引了超千名专业人士及爱好者参与,为全球人工智能领域奉献了一场兼具学术深度与实践价值的思想盛宴,成为年度行业发展趋势的重要风向标。先进专家齐聚 共创AI未来为期三天、一共三个会场的论坛同时吸引了国

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

IT之家 4 月 18 日消息,据外媒 The Verge 今日报道,谷歌成为最新一位加入高校市场竞争的 AI 服务商。从即日起,美国大学生可以免费订阅 Google One AI Premium,直到 2026 年 6 月 30 日,无需支付原本每月 20 美元(IT之家注:现汇率约合 146 元人民币)的费用。谷歌发言人 Alex Joseph 表示,想要申请的学生需在 2025 年 6 月

业界首个,阿里通义万相“首尾帧生视频模型”开源

IT之家 4 月 17 日消息,阿里通义万相「首尾帧生视频模型」今日宣布开源,该模型参数量为 14B,号称是业界首个百亿参数规模的开源首尾帧视频模型。它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型,或在 Github、Hugging Face、魔搭社区下载模型本地部署后进行

OpenAI 最强推理模型 o3 / o4-mini 发布后,“照片查位置”成最新热门玩法

IT之家 4 月 18 日消息,据外媒 TechCrunch 今日报道,如今越来越多用户开始用 ChatGPT 来破解照片拍摄的具体地点,成为一种迅速在网络上扩散且令人担忧的新现象。本周,OpenAI 推出两款新模型 ——o3 和 o4-mini,均具备图像推理功能,能够通过上传的照片分析画面细节,甚至还能对模糊或变形的图片进行裁剪、旋转和放大,完成更深入的识别。借助这种分析能力,再结合模型的网

OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性

IT之家 4 月 18 日消息,据外媒 TechCrunch 今日报道,为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据

599 元 → 388 元:小米 MIJIA 智能音频眼镜悦享版国补再降价

小米 MIJIA 智能音频眼镜・悦享版去年 3 月上市,官方定价 599 元。今日京东直降至 499 元,今晚 20:00 起叠加 200-20 元券(点此领券)与 15% 政府补贴,实付 407 元即可入手。晒单再返 20 元京豆,折合仅需 388 元好价:京东小米 MIJIA 智能音频眼镜悦享版 圆形时尚款多重优惠 388 元直达链接另外小米新款“MIJIA 智能音频眼镜 2”也支持今晚 2

字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体

IT之家 4 月 18 日消息,IT之家从豆包大模型团队获悉,UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。有关的链接如下:GitHub:https://github.com/bytedance/UI-TARSWebsite:https://seed-tars.com/Arxiv:https://arxiv.org

微软 BitNet b1.58 2B4T 登场:内存占用仅 0.4GB,20 亿参数模型颠覆 AI 计算

IT之家 4 月 18 日消息,科技媒体 WinBuzzer 昨日(4 月 17 日)发布博文,报道称微软研究团队推出了一款开源大型语言模型 BitNet b1.58 2B4T,区别于传统训练后量化的方式,这款拥有 20 亿参数的大型语言模型(LLM)以 1.58 位低精度架构原生训练而成。IT之家援引技术报告介绍,该模型性能直追同规模全精度模型,但计算资源需求大幅缩减。尤其令人瞩目的是,其非嵌

METR 实测:OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

IT之家 4 月 18 日消息,风险测试机构“机器智能测试风险”(METR)昨日(4 月 17 日)发布报告,与 OpenAI 合作测试其 o3 模型时发现,该模型展现出更强的“作弊”或“黑客行为”倾向,试图通过操控任务评分系统提升成绩。IT之家援引报告内容,在 HCAST(人类校准自主软件任务)和 RE-Bench 测试套件中,o3 模型约 1% 到 2% 的任务尝试涉及此类行为。这些行为包括

谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线:性能成本双优

IT之家 4 月 18 日消息,谷歌公司昨日(4 月 17 日)发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。用户还可通过 Gemini 应用内的模型选择器直接使用,并结合 Canvas 工具优化文档和代码编辑。IT之家此前报道,Gemini 2.5 Fla

年后完成第四轮融资,智谱再获北京人工智能产业投资基金 2 亿追投

感谢IT之家网友 Skyraver 的线索投递!IT之家 4 月 18 日消息,4 月 16 日,北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2 亿元人民币,支持智谱的开源模型研发与开源社区生态建设。北京市人工智能产业投资基金表示,智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模

中国移动发布移动爱家 AI 拍摄眼镜与 AI 音频眼镜

IT之家 4 月 18 日消息,中国移动智慧家庭运营中心 4 月 15 日在第五届中国国际消费品博览会上发布了全新产品“移动爱家 AI 眼镜”。移动爱家 AI 拍摄眼镜与 AI 音频眼镜通过深度融入大模型,可实现智能体视频通话、跨应用联动、辅助教育、协作办公等功能。移动爱家 AI 眼镜号称配备了“三个技能”:“好耳机”:在音质方面,采用双麦 ENC 通话降噪,经过数千次的音频调试,环境噪声抑制能

一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter

感谢IT之家网友 Alive1 的线索投递!IT之家 4 月 18 日消息,腾讯混元今日宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。腾讯官方介绍称,通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。输入原始图片+ prompt :a  rabbit is in the kitchen ho

微软 AI 负责人预测:未来“智能”成为新货币,知识和能力比钱更重要

IT之家 4 月 18 日消息,在接受 Jules Terpak 频道采访时,微软人工智能业务首席执行官穆斯塔法・苏莱曼(Mustafa Suleyman)表示,未来“智能”将成为新的货币,将重新定义财富与生活的本质。生成式 AI 技术正以惊人速度改变我们的生活方式,从工作到娱乐,几乎无处不在。尽管有人对其安全性与隐私问题表示担忧,但这并未阻挡技术普及的浪潮。IT之家翻译苏莱曼采访内容如下:我们