标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
95.03万
粉丝
11569
文章
214.41万
总浏览
5
平均评分
AI领域资深专家
LongCat-Audio-Codec是什么LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案,专为语音大语言模型(Speech LLM)设计。通过语义和声学双 Token 并行提取机制,兼顾语音的语义理解与声学特征保留,解决了传统方案中语义与声学信息难以平衡的问题。低延迟流式解码器支持实时交互,将解码延迟控制在百毫秒级,满足车载语音助手、实时翻译等场景的
谷歌最新视频生成模型 Veo 3.1 来了!今日上手可用。北京时间 10 月 16 日,谷歌在 Gemini API 中发布了 Veo 3.1 和 Veo 3.1 Fast 付费预览版。模型一上线,就受到了行业的高度关注。毕竟,和前不久发布的 Sora 2 一样,这次 Veo 3.1 也新增了音频功能。相较于上一代 Veo 3 来说,Veo 3.1 此次提升主要聚焦在三大方面:第一,是 A
机器狗搬轮胎,“五只腿”齐发力!在波士顿动力人工智能研究所的最新方法 —— 结合采样与学习的动态全身操作中,波士顿动力的机器狗 Spot 最快仅用 3.7 秒就能搬起轮胎。搬运的轮胎重达 15 公斤,相当于 Spot 自身重量的一半(32.7 千克),并远超其最大臂力。而且,搬起轮胎后,它还能将轮胎滚动到指定位置。甚至还能把一个轮胎叠到另一个轮胎上面(还会用头帮忙顶一下)。这一方法克服了传统操作
感谢IT之家网友 康斯坦丁 的线索投递!IT之家 10 月 17 日消息,2025 年世界互联网大会乌镇峰会新闻发布会于 10 月 17 日下午在京举办,据光明网报道,2025 年世界互联网大会乌镇峰会即将于 11 月 6 日至 9 日举办。世界互联网大会秘书长任贤良透露,今年聚焦构建网络空间命运共同体理念提出 10 周年,谋划了一系列新议题、新活动。本次峰会创新设置“六小龙乌镇对话”,邀请来
IT之家 10 月 17 日消息,英伟达官方美国加州当地时间 13 日宣布,Meta 和 Oracle 甲骨文将为 AI 数据中心网络导入英伟达 Spectrum-X 以太网交换机。两家科技巨头将把这一 AI 网络利器标准化为一种开放的加速网络架构,加快大规模部署,显著提升 AI 训练效率,并缩短获取洞察的时间。其中 Oracle 将构建由英伟达 Vera Rubin 架构提供加速并通过 Spe
通用人工智能AGI可能是人类历史上最重要的技术,但这个词本身长期模糊不清、标准不断挪动。随着窄域 AI 把越来越多“看似需要人的智慧才能干”的活干得有模有样,人们对“什么才算 AGI”的门槛就跟着改,导致讨论经常流于口号,既不利于判断差距,更阻碍治理与工程规划、我们也很难看清当下 AI 距离 AGI 还有多远。为拨开AGI的迷雾,这篇由UC伯克利、牛津等27家机构联合发布的论文给出了一个可量化的
目前,所有主流 LLM 都有一个固定的上下文窗口(如 200k, 1M tokens)。一旦输入超过这个限制,模型就无法处理。即使在窗口内,当上下文变得非常长时,模型的性能也会急剧下降,这种现象被称为「上下文腐烂」(Context Rot):模型会「忘记」开头的信息,或者整体推理能力下降。这种现象在现实使用中远比在标准化基准测试中更明显。当用户与 ChatGPT 等主流 LLM 进行长时间、多轮
英伟达桌面超算,邪修玩法来了!两台DGX Spark串联一台苹果Mac Studio,就能让大模型推理速度提升至2.77倍。这是GitHub三万星大模型框架作者EXO Lab团队发布的最新成果。这个EXO Labs,专门研究把大模型放到各种家用设备上运行。之前让MacBook、iPad、手机等设备组成集群跑405B大模型的分布式推理框架,还有两台Mac跑满血DeepSeek-R1,都是这家工作室
AMD再下一城!Oracle宣布自2026年第三季度起,将在其云基础设施(OCI)部署5万颗AMD Instinct™ MI450系列GPU,构建全新AI超级集群,并计划持续扩容。此举标志着AMD与Oracle的合作迈入新阶段,也被视为AMD在打破英伟达长期主导的AI算力生态中的又一关键突破。英伟达主导的AI算力生态,正面临一场AMD「5万颗AI芯片大单」所带来的挑战!刚刚,Oracle官宣将自
发疯文学的“疯”,终于是让AI给呐喊出来了。例如电视剧《180天重启计划》中的这段发疯名场面:然后啊,我们让AI用于谦+郭德纲的腔调打开这段对话,画风是这样的: 这要放以前,那些平平淡淡的AI语音,这癫感、这呐喊,大概率是发不出来的。那为什么现在AI就可以做到了呢?因为就在刚刚,火山引擎把豆包语音大模型升级了——语音学会了思考,更能理解台词,情感表达更有张力。具体来说,火山引擎这次主要升级了2