谷歌DeepMind Genie 2亮相《60 Minutes》,革新3D交互环境生成技术

CBS著名栏目《60Minutes》深入报道了谷歌DeepMind人工智能研究实验室的最新突破,重点聚焦其全新AI模型——Genie2。据AIbase了解,Genie2能够从单一图像或简单文本描述生成高度逼真的3D交互式环境,为机器人训练、虚拟世界构建及通用人工智能(AGI)发展开辟了新路径。社交平台上的热烈讨论凸显了其技术革新性,相关细节已通过DeepMind官网(deepmind.google

GPT-4o图像生成功能现已集成至自定义GPTs

2025年4月26日 AIbase报道:OpenAI近日宣布,其旗舰多模态模型GPT-4o的图像生成功能现已正式集成至ChatGPT的自定义GPTs功能中。这一更新标志着用户创建的定制化AI助手能够直接生成和编辑图像,为内容创作、设计和教育等领域带来更多可能性。无缝集成的图像生成体验GPT-4o的图像生成功能此前已于2025年3月25日起在ChatGPT和Sora平台向免费、Plus、Pro和Te

微软在瑞士投资 4 亿美元 扩展云计算与人工智能基础设施

微软宣布将投资4亿美元用于加强其在瑞士的云计算和人工智能(AI)基础设施。这项投资是在瑞士经济部长盖伊・帕默林与微软副主席布拉德・史密斯的会谈中透露的,标志着微软在人工智能和云服务领域的持续扩张。微软在瑞士的业务团队目前约有1000名员工,新的资金将主要用于日内瓦和苏黎世附近数据中心的扩建与升级。这一举措旨在满足瑞士市场对云计算和人工智能服务日益增长的需求。随着各行业对这些技术的依赖加深,微软的扩

昔日巨头 Digg 归来:以零知识证明对抗机器人,构建创作者友好型社区

在人工智能生成内容日益泛滥、威胁淹没真实人类声音的当下,昔日的新闻聚合巨头 Digg 正试图以全新的面貌回归,重拾早期互联网的社区精神。创始人 Kevin Rose 和 Reddit 联合创始人 Alexis Ohanian 联手,希望将 Digg 打造成一个属于人工智能时代的社交平台,在这个平台上,内容创造者和社区管理者将从平台的成功中获得更直接的回报。Digg 曾是 Web2.0时代的明星,2

DroidRun正式开源,LLM驱动Android手机自动化控制新突破

近日,一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。据AIbase了解,DroidRun已正式开源,源代码现已推送至GitHub,为开发者与技术爱好者提供了自由探索与二次开发的机会。功能亮点:自然语言驱

腾讯增持智元机器人

企查查APP显示,近日,智元机器人关联公司上海智元新创技术有限公司发生工商变更,广西腾讯创业投资有限公司持股比例由约2.06%增加至约2.7%。企查查信息显示,该公司成立于2023年,法定代表人为邓泰华,现由桑蓬(上海)科技合伙企业(有限合伙)等共同持股。

Direct3D-S2 横空出世!千兆级3D生成提速近10倍,AI建模进入新纪元!

近日,一款名为 Direct3D-S2的全新3D 生成框架引发了业界热议。该框架通过创新的 空间稀疏注意力(SSA)机制,显著提升了高分辨率3D 图像生成的质量与效率,为千兆级3D 生成提供了更具可扩展性的解决方案。AIbase 综合整理最新信息,带您深入了解 Direct3D-S2的技术突破与应用前景。空间稀疏注意力:效率与质量的双重飞跃Direct3D-S2的核心创新在于其 空间稀疏注意力(S

Voila – 开源端到端语音大模型,实现低延迟语音对话

Voila是什么Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力,支持数百万种预构建和自定义声音,用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。 包含两个主要模型:Voila-e2e 用于端到端语音对话,Voila-autonom

微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升

IT之家 5 月 19 日消息,微软近日为 Copilot AI 推送了最新更新,其中最重要的功能是加入了对 OpenAI 的 GPT-4o 图像生成技术的支持。IT之家曾报道,今年早些时候,OpenAI 推出了 GPT-4o 图像生成器,其强大的功能引发热议,尤其是生成的吉卜力风格(Ghibli)表情包在网上火爆一时。微软表示:“我们已将 Copilot 的图像生成功能升级至 4o 图像生成,

谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图

IT之家 5 月 1 日消息,谷歌在当地时间周三发布的博客中宣布,Gemini 聊天机器人应用目前支持修改由 AI 生成的图像以及用户从手机或计算机上传的图像。据IT之家了解,Gemini 的本地图像编辑功能将从今天起逐步推向全球,预计在未来几周内,服务将扩展至大多数国家,并支持超过 45 种语言。此次推出紧接着谷歌 3 月在 AI Studio 平台上测试的 AI 图像编辑模型,该模型因能删除

三星进军 AI 机器人领域,Ballie 本周公开亮相

IT之家 4 月 9 日消息,三星公司昨日(4 月 8 日)通过官方 Instagram 平台,预告将于本周在某个舞台上,展示 Ballie 机器人,可能会公布该机器人的发售细节。Ballie 是一款深度集成 SmartThings 平台的 AI 伴侣机器人,配备摄像头和迷你投影仪,能够在家中跟随用户,它不仅能够提供天气预报、播放电影、展示三星健康数据,还能协助管理购物清单、控制智能家居设备等。

DataBahn.ai推出“数据礁”智能化安全情报的新时代

在网络安全领域,如何快速而准确地处理海量数据是企业面临的一大挑战。最近,数据科技公司 DataBahn.ai 推出了一款名为 “数据礁”(Reef)的创新产品,旨在将高流量、高速度的安全监测信息转化为及时、可操作的情报,帮助企业做出更明智的决策。如今,企业收集的日志、警报和监测数据多达数 PB,但实际上仅分析不到5%。这意味着绝大多数数据未被充分利用,关键的信息往往被淹没在海量的噪音中。“数据礁”

奥特曼:使用 ChatGPT 的方式,暴露了你的年龄!

OpenAI 首席执行官 Sam Altman 表示,使用人工智能的方式会因年龄而异。在一次 AI 活动上,Altman 解释了不同年龄段的人如何以自己的方式使用 ChatGPT。Altman 表示,老年人使用 ChatGPT 来替代谷歌,而 20 多岁和 30 多岁的人则将其视为生活顾问。在一次人工智能活动中,奥特曼解释了不同年龄群体如何以各自的方式使用 ChatGPT。据他介绍,年长者将

​Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头

科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。这一阶段主

苹果、谷歌、Meta、OpenAI都在抢的新赛道,中国公司的机会在哪?

声明:本文来自于微信公众号 硅星人Pro,作者:王飞,授权站长之家转载发布。五天前,一笔震惊科技圈的重磅收购案浮出水面。OpenAI宣布以高达65亿美元的价格,收购了由前苹果首席设计官Jony Ive创办的AI硬件公司io,并计划将其打造为一个专注消费级智能设备的核心部门。Jony Ive、约55名的硬件工程师、软件开发人员和制造专家,以及一个梦想中的AI硬件造就了OpenAI历史上最大手笔的

7个月ARR 1.2亿美元,昆仑万维靠“短剧+AI”找到了新增长点

声明:本文来自于微信公众号 白鲸出海 作者:张凯然,授权站长之家转载发布。近2年,短剧出海持续升温,吸引了大量中国厂商积极入局。DataEye-ADX 的数据显示,截止2025年2月该品类在投应用数已经达到了231款,是去年同期的4倍,与快速增长的平台数量对应的是,从业者对这一市场前景普遍乐观的预判。据某头部媒体发布的行业白皮书显示,海外短剧月均用户已达2000-4000万,未来短剧预计将覆盖