三星发布冰箱“新技能”:一句“嗨,Bixby”帮你找到手机 185 0 IT之家 3 月 30 日消息,据彭博社今日报道,除了 Galaxy Watch 之外,三星设备的用户目前可以通过该公司最新推出的冰箱来找到自己的手机了。最新的 Bespoke AI 智能冰箱系列配备了 9 英寸的触控屏,用户只需说一句:“嗨,Bixby,找到我的手机。”增强版的助手能识别每个家庭成员的声音,并准确在对应的设备上发出通知。据IT之家了解,用户还可以用语音控制家里的空调或窗帘,而系
有效利他主义 OpenAI 阿尔特曼 AI安全 投资人警告阿尔特曼:OpenAI 内部安全危机加剧 185 0 近日,有关 OpenAI 内部紧张局势的报道浮出水面,投资人彼得・蒂尔在2023年11月阿尔特曼被解雇前夕,曾对阿尔特曼提出警告,关注 AI 安全倡导者与公司商业方向之间的冲突。据《华尔街日报》的报道,蒂尔在洛杉矶的一次私人晚宴上,向阿尔特曼提出了这一问题。他特别提到了 “有效利他主义”(Effective Altruism)运动在 OpenAI 内部的影响,称阿尔特曼未能意识到 AI 研究者尤利
MAGI-1 自回归视频生成大模型 SandAI 视频生成 全球首个自回归视频生成大模型 MAGI-1 重磅发布,Swin Transformer 团队引领视频创作新潮流 185 0 在视频生成领域,最近涌现出了一位强劲的新选手 ——MAGI-1。这款由马尔奖和清华特奖得主曹越领导的创业公司 Sand AI 推出的自回归视频生成大模型,正在重新定义视频创作的可能性。MAGI-1通过预测视频块的序列来生成视频,以其自然流畅的效果和多个可下载版本引发广泛关注。MAGI-1在生成视频时具有诸多优越性能。首先,它提供了无缝流畅的视频体验,能够生成连续的长视频场景,没有尴尬的剪辑或突兀的
AutoGLM沉思 智谱AI Agent GLM-Z1-Air 智谱发布Agent产品AutoGLM沉思:首个实现"边想边干"的智能体 185 0 今日,智谱AI在2025中关村论坛上发布了其最新Agent产品——AutoGLM沉思。这是业内首个集深度研究能力和操作能力于一体的Agent产品,其最大特点是能够"边想边干"。AutoGLM沉思突破了传统AI模型的局限,能够同时进行复杂思考与执行操作。它可以像人类一样打开并浏览网页,完成从数据检索、分析到生成报告的全流程任务,实现了思考与行动的紧密结合。智谱表示,AutoGLM沉思背后的技术支撑是
IBM 首席执行官进军人工智能市场并加大美国投资 185 0 在最近的一次采访中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,随着人工智能(AI)市场竞争的加剧,IBM 正计划通过提供能够整合客户使用的不同 AI 代理的工具,来提升其在该领域的销售。这些工具将帮助客户管理他们在关键业务应用中的一系列 AI 代理,主要包括 Salesforce、Workday 和 Adobe 等公司的产品。克里希纳指出,IBM 将助力客户构建适合
在线设计平台 Canva 新增多项 AI 技能:图片生成、互动编程、电子表格等 185 0 IT之家 4 月 11 日消息,在线设计平台 Canva 周四宣布计划向其平台添加一系列新 AI 功能,其中包括 AI 助手、通过指令生成应用的功能、电子表格支持以及 AI 驱动的编辑工具。名为 Canva AI 的 AI 助手能完成多种任务,不论是根据用户要求生成图像,还是提出社交媒体宣传资料或印刷样本等设计创意,其都能应对,还支持自动撰写文案和制作文档。借助 Canva Code 这一新工具
英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05% 185 0 IT之家 5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。Parakeet TDT 0.6B 的核心优势在于其无与伦比的速度和转录质量。该模型仅需 1 秒即可处理 60 分钟音频,是现有主流开源 ASR 典型模型
美国 NBC 电视台“AI 体育主播”上岗,将模拟已故解说员声音报道 NBA 赛事 185 0 IT之家 5 月 7 日消息,据外媒 The Verge 今日报道,美国 NBC 电视台即将推出的 NBA 赛事转播将使用 Jim Fagan 的 AI 生成声音。NBC 在周二的公告中宣布,当网络在 10 月重新播出 NBA 比赛时,Fagan 的 AI 声音将出现在一些片头、节目开场和宣传片中。Fagan 是一名 2017 年过世的资深体育解说员,他的声音曾出现在 NBC 的 NBA 转播中
豆包1.5深度思考模型 火山引擎 MoE架构 AI大模型 字节发布豆包1.5深度思考模型:多模态深度思考、延迟低 184 0 在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注,谭待在会上分享了该模型在多个领域的优异表现。据悉,豆包1.5模型在数学、编程、科学推理等专业领域,以及创意写作等任务中,都展现出了卓越的能力。这款新模型采用了 MoE(混合专家)架构,总参数达200亿,而激活参数仅为20亿,显著低于行业同类模型
ChatGPT 图像生成功能火爆,OpenAI CEO 称容量问题将导致产品延期 184 0 感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 4 月 2 日消息,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)在社交媒体平台 X 上发布了一系列帖子,透露该公司新推出的 ChatGPT 图像生成工具的高人气引发了产品延迟等一系列问题。奥尔特曼表示:“我们正在努力控制局面,但用户应该预料到 OpenAI 的新版本发布将会延迟,一些功能可能会出现故障,并且由于我们正在应对巨
DeepSeek 首次用于地震国际救援,7 小时攻克缅甸救灾语言关 184 0 IT之家 4 月 2 日消息,近日缅甸发生 7.9 级地震,灾情牵动人心。在救援行动中,一项由中国团队开发的中缅英互译系统发挥了重要作用,为救援工作的顺利开展提供了有力支持。据央视新闻报道,地震发生后,中国驻缅甸使馆称,在救援工作中使用了基于 DeepSeek 紧急开发的中缅英互译系统。该系统由国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队,在短短七小时内利用 DeepSeek
UniToken 多模态建模 视觉编码 图文理解 UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成 184 0 声明:文来自微信公众号“量子位”,作者:UniToken团队,,授权站长之家转载发布。首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局!复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”
三星智能家居平台 SmartThings 现已支持 Matter 1.4:兼容设备含热水器、热泵等 184 0 IT之家 4 月 9 日消息,据外媒 The Verge 今日报道,三星的智能家居平台 SmartThings 现已支持 Matter 1.4。这是最新发布的智能家居互联标准版本,新增了对热水器、热泵、太阳能电池板等设备的兼容性。与此同时,三星还推出了新的智能家居自动化触发器,以及 SmartThings 连接扬声器的广播功能。Matter 1.4 使设备可以在多个平台上同时使用,并提供了更加精
AI模型真实度 VectorInstitute 开放源代码模型 AI基准评测 Vector Institute 发布 AI 模型性能评估报告,助力透明性与可信度 184 0 人工智能(AI)模型的发展速度让人眼花缭乱,技术开发者们在不断提升其性能的同时,也引发了用户对于模型表现真实度的疑虑。为了解决这一问题,由杰弗里・辛顿(Geoffrey Hinton)创办的 Vector Institute 为人工智能研究推出了《评估现状研究》。该研究通过互动排行榜对11个顶尖的开放源代码和闭源模型进行了全面评测,涵盖了数学、通用知识、编码、安全性等16个基准。Vector In
Luma Ray2 Camera Concepts API 发布:AI 视频生成迈向电影级控制 184 0 Luma AI 宣布其旗舰视频生成模型 Ray2的 Camera Concepts API 正式上线,为开发者提供了前所未有的电影级镜头控制能力。结合此前推出的 Camera Motion Concepts 和 Camera Angle Concepts,这一 API 的发布标志着 AI 视频生成技术在创意控制和生产效率上的重大突破。Camera Concepts API:赋予开发者电影级创意控制
Klavis AI 推出开源 MCP 集成,支持大规模用户和自定义工具 184 0 Klavis AI(YC X25)正式推出其全新的开源 MCP 集成解决方案,旨在为开发者提供一个高效、稳定的环境,以便于他们在 AI 应用中进行快速集成和部署。该项目已经在 GitHub 上发布,吸引了大量开发者的关注,迄今为止获得了973颗星和140个叉子。Klavis AI 的 MCP集成提供了一套全面的工具和资源,使得开发者能够在极短的时间内将自己的 AI 应用与生产就绪的 MCP 服务器