Member standard
Member expire
Member points 0
还没有账号? 立即注册
已有账号? 立即登录
95.03万
粉丝
11569
文章
214.41万
总浏览
5
平均评分
AI领域资深专家
IT之家 8 月 7 日消息,谷歌的 Gemini AI 推出了一项名为“引导式学习”(Guided Learning)的新功能,旨在帮助用户真正理解他们所学习的问题,而不仅仅是直接给出答案。谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在其博客文章中表示,这种“引导式学习”模式充当了“学习伴侣”,通过“提问和逐步指导”来引导用户。“引导式学习”模式提供的答案形式丰富多样,包括图片、
IT之家 8 月 7 日消息,谷歌公司今天(8 月 7 日)发布博文,宣布正式推出异步 AI 编程智能体工具 Jules,由 Gemini 2.5 Pro 驱动,可集成 GitHub,支持异步修复与更新代码。IT之家注: Jules 支持集成 GitHub,可以将代码库克隆到 Google Cloud 虚拟机中,可在 GitHub 仓库中异步处理任务,帮助开发者提高工作效率。Jules 于今年
感谢IT之家网友 四文鱼 的线索投递!IT之家 8 月 6 日消息,面壁智能 8 月 5 日宣布开源 MiniCPM-V 4.0,该模型在图像理解能力上超越了 GPT-4.1-mini-20250414。该模型不仅继承了 MiniCPM-V 2.6 的众多实用特性,还大幅提升了推理效率。面壁智能还同步开源了适用于 iPhone 和 iPad 的 iOS 应用。面壁智能介绍称,MiniCPM-V
IT之家 8 月 6 日消息,AI 音频产品公司 ElevenLabs 昨日发布了 Eleven Music 文字转音乐 AI 模型,号称能够生成任意风格的录音室级别音频,其中付费版本支持商用。据介绍,Eleven Music 可以根据用户输入的提示生成各种音乐类型,还可选择音乐中的构成元素(例如是否包含人声或特定乐器)。目前支持生成英语、西班牙语、德语、日语歌曲。生成后,用户还可对歌曲的部分片
dots.vlm1是什么dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于一个从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能力。模型在视觉理解和推理任务上表现出色,接近闭源 SOTA 模型水平,在文本任务上也保持了竞争力。dots.vlm1 的视觉编码器 NaViT 完全从零开始训练,原生支
经过两年多的发展后,AI开始加速进入Agent时代。当AI从“被动响应”迈向“主动决策”,AI Agent正成为连接数字世界与物理世界的核心枢纽。从自动处理客户服务工单的企业Agent,到协调多步骤科研实验的学术Agent,再到管理智能家居生态的个人Agent,这种具备推理、规划、记忆与工具使用能力的智能体,正在重塑产业形态。但支撑其智能的,是一套复杂且精密的基础设施——它不仅包含算法与模
新能源普及多年后,一场悄然而至的变革正在汽车行业发生。车企之间的较量,似乎正从传统的造车技艺,逐渐转向了对AI技术的深度角逐。不久前,理想汽车在新品发布会上,没有将重点过多放在车辆的硬件参数上,而是将大把时间放到了介绍车机智能化的新进展,以及VLA技术下智能驾驶的进化之路。同时,吉利汽车携手阶跃星辰,联合发布了面向AI Agent原生打造的下一代智能座舱Agent OS(预览版)“智能蛋舱”
在AI的催化下,从去年下半年开始,“具身智能”这个词突然火了。但说到底,具身智能离普通人的生活还很远。现实中,真正能卖爆的AI硬件,既不是能跳舞的机器人,也不是炫技的多模态终端,而是那些埋进生活细节、解决小问题的小设备。乌鸦君翻遍亚马逊和TikTok平台的销量数据,发现最能打的,反而是那些看起来毫不起眼,却刚好踩中刚需场景的产品:一枚Oura智能戒指,轻若无物却能追踪全套睡眠指标,悄悄卖
进入移动互联网时代的下半场后,伴随着流量红利的枯竭,几乎所有巨头都开始明里暗里“建墙”。以开放为代表的互联网精神不可避免地开始凋零,以邻为壑则成为了主旋律,其中最典型的代表就是“二选一”。相比于无边界扩张的国内互联网大厂,聚焦主业的美国互联网圈还未撕下了温情脉脉的假面具,然而这一切随着生成式人工智能的出现成为了过去式。为了夺取AI领域的“圣杯”AGI(通用人工智能),Meta开始不计成本地挖
如果说过去几年,生成式 AI 的突破让我们学会了和算法对话,能让它帮我们写文章、画插画、甚至剪视频,那么 DeepMind 在这个今天抛出的 Genie 3,又让生成式 AI 走进了另一个维度。8 月 5 日,DeepMind 在官网公布了 Genie 3,一款被称作「通用世界模型」的新模型。打开 Genie 3,输入一句 prompt「在一个暴风雨中的中世纪村庄漫步」,几秒钟后,Genie