
AI IN ALL!
人工智能
吉卜力
controlnet
RunningHub
RH一人成军
AI教程
ai
flux
AI绘画
5亿用户捧出“教育界消消乐”,多邻国靠AI能走多远?
声明:本文来自于微信公众号 Tech星球(ID:tech618),作者:任雪芸,授权站长之家转载发布。即便你从未使用过多邻国,也大概率对它并不陌生。在抖音、小红书等社交平台上,“多邻国受害人”“忠诚绿鸟兵”“多邻国后遗症”等话题的视频热度居高不下,不少用户带着从多邻国“突击”学到的蹩脚粤语自信“实战”。他们大都只学会了多邻国里的早茶四件套:虾饺、肠粉、烧卖、豉汁排骨。喝茶只会点铁观音、菊花茶和
谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒
IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。DeepMind 希望通过这
Opera 介绍 Neon AI 浏览器技术细节,内嵌 Operator 模型分析网页 DOM 树 / 排版实现自动化操作
IT之家 5 月 31 日消息,Opera 在 5 月 28 日宣布推出一款全新 Opera Neon 浏览器,主打 AI 功能,官方称该浏览器可以帮助用户撰写报告、玩在线游戏、完成各种任务。目前,该公司公布了这款浏览器的具体技术细节,官方称这款 Opera Neon 可被视为 2017 年同名浏览器的“重磅回归”,与其他“只是在浏览器中整合 AI 工具”的 AI 浏览器有显著不同,除了内置 A
Figure完成史上最大重组:三大技术团队合并成AI核心小组Helix
人形机器人公司Figure今日宣布完成公司历史上规模最大的组织重组,CEO Brett Adcock通过推特透露,上周已将三个独立技术团队合并进新成立的AI小组Helix,旨在打破部门壁垒,加速人形机器人的商业化进程。以AI模型命名的战略整合新成立的Helix小组以Figure三个月前推出的首个VLA(视觉-语言-行动)具身模型Felix的核心技术命名,凸显了AI在公司战略中的核心地位。据Figu
奥运攻关技术创新联合体在北京成立,将建全球最长智能跑道、首个国人运动人体专业多模态大模型
IT之家 5 月 29 日消息,奥运攻关技术创新联合体于 5 月 28 日在北京市经济技术开发区(北京亦庄)成立。成立仪式上,国家体育总局体育科学研究所与近 60 家单位现场签约,超 20 家企业参加奥运攻关代表性科研成果展,发布国家级人工智能体育健康应用基地。国家体育总局科教司司长陈志宇,北京经开区工委委员、管委会副主任王磊出席仪式并致辞。奥运攻关技术创新联合体由国家体育总局体育科学研究所牵头
Anthropic CEO 阿莫代伊警告:未来五年 AI 可能消灭半数入门级白领工作
IT之家 5 月 29 日消息,当地时间 28 日,外媒 Axios 公布了采访 Anthropic CEO 达里奥・阿莫代伊的内容。他警告称,AI 可能会在未来五年内摧毁多达一半的初级白领岗位,导致失业率上升至 20%。阿莫代伊指出,AI 技术的飞速发展正对初级白领职业构成重大威胁,尤其是在科技、金融、法律、咨询等领域。他警告称,这一趋势将在一至五年内迅速显现,但外界对此普遍缺乏警觉。他批评政
谷歌官方相册 App 迎十周岁生日:消除、增强等 Pixel 9 专属 AI 功能下放
IT之家 5 月 29 日消息,谷歌官方的相册 App 迎来十周年,为此谷歌今日宣布将全面升级应用中的编辑器,生成式 AI 则是此次更新的核心亮点。新版相册将 Pixel 9 专属的“魔术编辑器”功能开放给更多用户。比如“自动裁剪”功能会智能推荐照片的最佳裁剪方式,若需填补空白,AI 还能直接生成缺失部分。另外,“重新想象”功能也同步推出,用户可为照片添加原本不存在的元素,如秋叶或绿草。鉴于生成
快手可灵 AI 上线 2.1 系列模型:不到 1 分钟生成 5 秒 1080p 视频,更快更便宜
感谢IT之家网友 西窗旧事 的线索投递!IT之家 5 月 29 日消息,快手可灵 AI 今日推出全新 2.1 系列模型,高品质模式(1080p)下生成 5s 视频仅需不到 1 分钟。据了解,其在标准模式(720p)下生成 5s 视频仅需 20 灵感值,高品质模式(1080p)下也只需 35 灵感值,成本下降 65%。据官方介绍,可灵 2.1 在动态表现方面,模型动态细节更好、动态响应更强、动态
“资助”社媒竞对,xAI 预计将为向 Telegram 集成一年 Grok 支付 3 亿美元
感谢IT之家网友 对的时间点、Jenny太美、咩咩洋、Coje_He 的线索投递!IT之家 5 月 29 日消息,社交媒体 Telegram 创始人兼首席执行官 Pavel Durov 宣布,其已与马斯克就一份一年期的合作关系达成原则性同意。马斯克旗下的 xAI 预计将向 Telegram 支付 3 亿美元的现金和股份换取 Telegram 对 xAI Grok 的一年集成,Telegram
中国欢迎有意愿的上合组织成员国共建人工智能应用合作中心
IT之家 5 月 29 日消息,据央视新闻报道,在 2025 中国-上海合作组织人工智能合作论坛上,中国发布《中国-上合组织国家人工智能应用合作中心建设方案》,并发出共建邀请。据了解,中国-上合组织国家人工智能应用合作中心建成后,将在夯实人工智能发展基础、提升开源开放服务、加强产业合作对接以及促进人才培育等方面发挥重要作用。具体内容包括:共建高质量数据集和语料库,推动数据安全有序跨境流动;提供数
通义大模型发布OmniAudio 可从 360° 视频生成空间音频
近日,通义实验室语音团队在空间音频生成领域取得里程碑式成果,推出OmniAudio技术,该技术可直接从360°视频生成FOA(First-order Ambisonics)音频,为虚拟现实和沉浸式娱乐带来全新可能。空间音频作为一种模拟真实听觉环境的技术,能提升沉浸式体验,但现有技术大多基于固定视角视频,对360°全景视频空间信息利用不足。传统视频到音频生成技术主要生成非空间音频,无法满足沉浸式体验
Meta 团队研究发现:简化推理链条能显著提升 AI 准确率
近期,Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究,表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。研究结果显示,使用较短推理链的 AI 模型准确率提高了34.5%,这一发现对当前 AI 行业的假设提出了挑战。图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,作者指出,长时间的思考链条并不一定能够带来更好的推理能力,反而
Meta 发布 Multi-SpatialMLLM:引领多模态 AI 的空间理解革命
科技巨头 Meta 与香港中文大学的研究团队联合推出了 Multi-SpatialMLLM 模型,这一新框架在多模态大语言模型(MLLMs)的发展中取得了显著进展,尤其是在空间理解方面。该模型通过整合深度感知、视觉对应和动态感知三大组件,突破了以往单帧图像分析的限制,为更复杂的视觉任务提供了强有力的支持。近年来,随着机器人和自动驾驶等领域对空间理解能力的需求不断增长,现有的 MLLMs 面临着诸多
40毫秒生成一个世界!Odyssey AI交互视频引爆Web4.0,免费试玩让你秒变虚拟探险家!
AI初创公司Odyssey宣布推出其突破性的AI交互视频技术,以每40毫秒生成并流式传输一帧的惊人速度,为用户带来无需传统游戏引擎即可实现的实时互动体验。这一技术被誉为“交互式视频”,融合了视频游戏与电影的元素,标志着数字化叙事领域的重大突破。AIbase为您整理了Odyssey这一创新技术的核心亮点及其对未来娱乐产业的深远影响。交互式视频:重新定义沉浸式体验Odyssey的AI交互视频技术允许用
全栈智能体Lemon AI横空出世:一键解锁多领域复杂任务
近日,创新型全栈通用AI Agent——Lemon AI正式亮相,掀起智能自动化热潮。Lemon AI以其强大的自主性和工具调用能力,从任务需求到成果交付实现全流程自动化,无需人工干预,为用户带来高效便捷的体验。Lemon AI集成自然语言处理、代码生成、网页浏览、API调用、系统命令执行及应用操作等多种功能,能够智能识别任务目标,自动规划完成步骤并调用所需工具。用户可通过页面端实时查看任务执行状
谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明
近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在AI评测领域的最新突破。AIbase为您整理了LMEval的最新动态及其对AI行业的影响。标准化评测:跨平台模型比较更简单LMEval的推出标志着AI模型评测进入了一个新阶段。该框架基于LiteLLM