谷歌推出 Project Astra,智能助理可控 Android 手机

谷歌近日正式发布了 Project Astra 的最新功能,该项目展示了其强大的智能助理能力,能够控制 Android 手机。这一技术目前已经以应用程序的形式提供给受信任的测试者,并在 Pixel9Pro 上进行了演示。在演示中,用户在修理自行车的过程中,与 Astra 进行实时对话。用户首先请求 Astra 在线查找一份 PDF 手册,Astra 随后打开文档,并以悬浮气泡的形式展示其触控操作,

​字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破

字节跳动 发布了一款名为 BAGEL 的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。BAGEL 在标准多模态理解基准测试中表现出色,超越了当前一些顶级开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2.5。此外,在文本到图像的生成质量上,BAGEL 的表现也与强大的专业生成器 SD3相媲美。更重要的是,BAGEL 在经典图像编辑场景中的效果优于许多领先的开源

继小红书后,抖音也开始专项治理“AI起号”!

声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。通过AI技术实现“日产千条视频、周产百个账号”,类似这样的“AI起号流水线”你有听过吗?近期,抖音开始重拳出击整治这些“AI起号”了!抖音对利用AI进行账号批量生产、传播虚假信息的黑灰产链条展开了重点打击,共清理了311条违规内容,封禁了“心x甜”等15个严重违规账号。这场针对“AI起号”的专项治理行动,近期不仅仅发生在抖音,

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

IT之家 5 月 21 日消息,科技媒体 marktechpost 昨日(5 月 20 日)发布博文,报道称英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。Physical AI 挑战人工智能(AI)在语言处理、数学和代码生成领域取得显著进步,但将其能力扩展到物理环境仍面临挑战

谷歌实验室推出新 AI 工具 Stitch:文字、图片可秒变 UI 设计与前端代码

IT之家 5 月 21 日消息,谷歌 I/O 2025 大会首日活动已经结束,众多更新与新工具发布,其中包括 Gemini 模型的升级、谷歌搜索中 AI 模式的更广泛推广以及用于媒体创作的全新生成式 AI 工具。而在众多亮点中,谷歌实验室(Google Labs)推出的一项名为 Stitch 的新实验项目颇为有趣。Stitch 旨在解决从构思用户界面到实现可运行代码这一过程中常见的繁琐与反复沟通

多邻国创始人:AI 教学优于人类,但学校仍将存在并承担托育功能

感谢IT之家网友 往事2016 的线索投递!IT之家 5 月 21 日消息,据《财富》20 日报道,语言学习应用多邻国近年来大举押注生成式 AI。这家以猫头鹰吉祥物闻名的公司去年在财报电话会议上曾用 AI 头像短暂“替代”CEO,更在上个月宣布将永久用 AI 取代合同工。多邻国的野心目前自然已不止于此。凭借每月 1.16 亿用户积累的大量学习数据,公司掌握了激发学习动机的方法,甚至可以在考试前

英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等,需要具备常识推理能力

字节跳动海外版剪映 CapCut 推出 AI 营销平台 Pippit,并注册相关商标

天眼查信息显示,北京字跳网络技术有限公司近期申请注册了多枚“PIPPIT”商标,覆盖教育娱乐、科学仪器、网站服务、广告销售等多个国际分类,目前商标状态均为等待实质审查。据公开资料,Pippit AI 是字节跳动旗下视频编辑应用 CapCut(剪映海外版)新近推出的 AI 营销内容创作平台,于今年4月份正式发布。此举表明字节跳动正积极拓展其在 AI 营销领域的布局。

Framer发布全新AI功能,Wireframer秒建网站,Workshop生成交互组件,Vectors 2.0与A/B测试引爆设计新热潮!

Framer在I/O2025期间宣布推出全新AI功能套件,包括Wireframer、Workshop、Advanced Analytics和Vectors2.0,通过AI驱动的网站布局生成、交互组件设计、矢量绘图升级和高级分析工具,显著降低了网站创建的成本和复杂度。这些功能面向所有用户开放,无需Beta测试,引发全球设计师和开发者社区的热烈反响。AIbase综合最新社交媒体动态,深入解析Frame

​腾讯混元 TurboS 技术报告全面揭秘,560B参数混合Mamba架构

腾讯发布了混元 TurboS 技术报告,揭示了其旗舰大语言模型 TurboS 的核心创新与强大能力。根据全球权威大模型评测平台 Chatbot Arena 的最新排名,混元 TurboS 在239个参赛模型中位列第七,成为国内仅次于 Deepseek 的顶尖模型,并在国际上仅落后于谷歌、OpenAI 及 xAI 等几家机构。混元 TurboS 模型的架构采用了创新的 Hybrid Transfor

腾讯大模型战略首次全景亮相!智能体平台重磅上线,从“落地可用”到“智能协同”

声明:本文来自于微信公众号 克雷西(ID:QbitAI),作者:量子位,授权站长之家转载发布。智能体的开发门槛,又又又被打下来了!昨天,腾讯云在他们的AI产业应用峰会上,正式上线了全新的智能体开发平台,率先在行业内实现零代码配置多智能体协同构建。除了上线智能体开发平台,腾讯云也对从AI Infra到模型到应用的整个体系来了波全面升级。包括混元系列大模型,也迎来了重磅更新。腾讯云副总裁吴永坚对量

聊天机器人被指诱导 14 岁少年自杀,美国法官裁定谷歌须与 Character.AI 共同担责

IT之家 5 月 22 日消息,据路透社 21 日报道,美国佛罗里达州一名母亲 Megan Garcia 指控人工智能平台 Character.AI 的聊天机器人导致其 14 岁儿子自杀。联邦法官裁定,谷歌与人工智能初创公司 Character.AI 必须面对这起诉讼。美国地方法官 Anne Conway 表示,谷歌与 Character.AI 在案件初期未能证明美国宪法关于言论自由的条款足以驳

英国 AI 初创企业 Builder.ai 宣布破产,曾获微软投资

IT之家 5 月 22 日消息,英国科技初创企业 Builder.ai 宣布进入破产程序,该公司曾是英国融资最多的科技初创企业之一。Builder.ai 总部位于伦敦,是一家专注于利用人工智能技术简化应用程序和网站开发流程的公司。该公司曾宣称其技术能够将开发过程变得“像点披萨一样简单”,并获得了包括微软和卡塔尔主权财富基金在内的多家顶级投资者的支持,累计融资超过 5 亿美元(IT之家注:现汇率约

京东发布行业首个以供应链为核心的工业大模型 Joy industrial

感谢IT之家网友 HH_KK 的线索投递!IT之家 5 月 23 日消息,5 月 22 日,京东工业于上海对外发布行业首个以供应链为核心的工业大模型 Joy industrial。IT之家从官方介绍获悉,Joy industrial 推出了满足京东工业及供应链上游供应商的需求代理、运营代理、关务代理等 AI 智能体,以及服务供应链下游企业用户的商品专家及集成专家等 AI 产品,并明确了打造汽车

微软邀测必应视频创建器:免费 AI 生成视频,基于 OpenAI Sora 模型,最长 5 秒、最高 480P

IT之家 5 月 23 日消息,科技媒体 Windows Latest 今天(5 月 23 日)发布博文,报道称微软正扩展必应图像创建器(Bing Image Creator),借助 OpenAI 的 Sora 模型,引入必应视频创建器(Bing Video Creator)。微软官方尚未官宣“必应视频创建器”功能,不过已经邀请部分用户测试,若测试进展顺利,用户未来或能像请求图片一样轻松生成视频

一图生万物?AI“神笔马良”3DTown,单张照片变3D城市,这波操作太秀了!

最近,一项黑科技直接颠覆了我们对3D 世界构建的认知!普林斯顿大学、哥伦比亚大学和一家叫 Cyberever AI 的公司,联手推出了一套名叫3DTown 的框架。听名字就知道,它就是来帮你搞3D 城镇的!最骚的是什么?它能仅仅凭借一张俯视图,就能帮你生成一个逼真、连贯的3D 城镇场景!  而且,它还是个免训练(training-free)的框架,这意味着你不用费劲巴拉地去收集海量3D 数据来训练