标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
95.03万
粉丝
11569
文章
214.41万
总浏览
5
平均评分
AI领域资深专家
在最近的一轮融资中,Abridge,这家致力于自动化医疗记录的人工智能初创公司,成功获得了3亿美元的 E 轮融资,使其估值达到53亿美元。这轮融资由著名投资机构 Andreessen Horowitz 领投,Khosla Ventures 也参与其中。值得注意的是,这一融资紧接着公司在2月份完成的2.5亿美元融资,当时估值为27.5亿美元。成立七年的 Abridge,凭借其在竞争日益激烈的 AI
近日,Google 意外发布了一篇关于 Gemini CLI 的博客文章,但目前该页面已返回404错误。这篇未正式公开的文章披露了 Gemini CLI 的多项关键功能,引发开发者社区热议。文章内容显示,Gemini CLI 是一款面向 Gemini2.5Pro 的开源命令行界面(CLI)工具,支持高达100万代币的上下文窗口,适合处理复杂代码和大规模数据。此外,该工具提供免费使用配额,每分钟支持
近日,来自 ETH Zurich、斯坦福大学和微软的研究团队推出了一项名为 SuperDec 的新方法,旨在通过超四面体原理实现紧凑且富有表现力的3D 场景表示。这一创新方法不仅能有效分解3D 场景中的各个对象,还可以应用于机器人技术和可控的视觉内容生成,为多种领域带来了新的可能性。SuperDec 的工作原理SuperDec 的核心思想是利用超四面体这一几何原件,对3D 场景进行局部处理。在处理
科大讯飞旗下的讯飞医疗科技正式在香港联交所上市,成为国内医疗大模型领域的先锋企业。在上市不到半年的时间里,讯飞医疗科技总裁陶晓东接受媒体采访时透露,基于市场需求和对未来的预判,公司预计将在未来1至2年内实现盈利。根据公司最新的财报,讯飞医疗科技在2024年的营收达到了7.34亿元,同比增长32%,尽管依然亏损1.33亿元,但亏损额相比前一年有所减少。值得一提的是,科大讯飞目前持有该公司49.42%
声明:本文来自于微信公众号 新播场,作者:场妹,授权站长之家转载发布。6月15日,罗永浩数字人在百度电商完成首场直播,吸引超1300万人次观看,GMV突破5500万元,创下数字人直播带货新纪录。在这场头部主播数字人首秀中,AI起着关键作用,不仅驱动数字人做出8300个动作,还生成高达9.7万字的剧本式产品讲解,连罗永浩本人都说:“如果没有数字人,这得把我累成啥样!”事实上,“头部主播+AI”带
近日,快手旗下的Z时代音乐K歌社区APP回森,受邀参与华为开发者大会2025(HDC2025),共话智慧时代技术的创新与应用。以技术创新与AI驱动的回森在音频领域拥有多项业界首创技术,致力于降低音乐创作门槛,在音乐作品的生产和互动上不断突破创新,构筑了新一代音乐K歌社区产品生态。在内容论坛的主题演讲环节,回森团队音视频研发专家杨阳分享了回森如何为热爱音乐的用户提供更便捷、更富想象力的创作体验,
微软Office「全家桶」的霸主地位,也要不保了?最新爆料称,OpenAI密谋一年计划在ChatGPT中加入两大办公功能——「文档协作」与「即时通讯」,战略版图已渗透到各个领域。OpenAI未来想要做的,便是吞掉微软、谷歌的市场。Information独家爆料称,OpenAI内部已筹划一年,计划在ChatGPT中植入「文档协作」与「即时通讯」功能。OpenAI这一步棋,直接向「金主爸爸」微软发起
Gemini Robotics On-Device是什么Gemini Robotics On-Device是谷歌DeepMind推出的首个可在机器人本地运行的视觉-语言-动作(VLA)模型。模型具备强大的离线操作能力,能遵循自然语言指令完成精细任务,如拉开袋子、叠衣服等。模型支持多种机器人本体部署,响应延迟低,适合对延迟敏感的应用。Gemini Robotics On-Device具备快速适应
OmniAvatar是什么OmniAvatar是浙江大学和阿里巴巴集团共同推出的音频驱动全身视频生成模型。模型根据输入的音频和文本提示,生成自然、逼真的全身动画视频,人物动作与音频完美同步,表情丰富。模型基于像素级多级音频嵌入策略和LoRA训练方法,有效提升唇部同步精度和全身动作的自然度,支持人物与物体交互、背景控制和情绪控制等功能,广泛应用在播客、互动视频、虚拟场景等多种领域。OmniA
AnimaTensor是什么AnimaTensor是CagliostroLab团队和TensorArt共同推出的二次元图像生成模型。基于创新的V-Prediction技术,用预测图像生成过程中的“速度”优化噪声调度和采样策略,提高图像质量和生成效率。AnimaTensor包含两个版本,Pro和Regular,分别提供不同的样本数和VAE配置。Pro版本在美学和语义理解方面表现更优,适合专业用户