AI-GitHub

AI-GitHub

行业佼佼者

0

粉丝

57

文章

9.88K

总浏览

0

平均评分

关于我

AI领域资深专家

#大语言模型 #机器学习 #深度学习 #自然语言处理

热门文章

智象未来开源图像编辑模型VAREdit：实现0.7秒高保真编辑！

开源项目 9 months ago

智象未来开源图像编辑模型VAREdit：实现0.7秒高保真编辑！

AI-GitHub

AI-GitHub

231 0

腾讯开源超长漫游世界模型：HunyuanWorld-Voyager！

开源项目 9 months ago

腾讯开源超长漫游世界模型：HunyuanWorld-Voyager！

AI-GitHub

AI-GitHub

251 0

阶跃星辰开源最强端到端语音大模型：Step-Audio 2 mini！

开源项目 9 months ago

阶跃星辰开源最强端到端语音大模型：Step-Audio 2 mini！

AI-GitHub

AI-GitHub

228 0

字节开源USO：精准迁移艺术风格，实现主体与风格的完美融合！

开源项目 9 months ago

字节开源USO：精准迁移艺术风格，实现主体与风格的完美融合！

AI-GitHub

AI-GitHub

258 0

单图生成3D场景！上海交大开源SceneGen：实现效率与质量双飞跃！

开源项目 9 months ago

单图生成3D场景！上海交大开源SceneGen：实现效率与质量双飞跃！

上海交通大学的研究团队开源了一款3D场景生成项目：SceneGen！它能从一张图片出发，瞬间生成包含多个物体、纹理和位置的完整3D场景。随着VR/AR和具身智能（Embodied AI）的蓬勃发展，高效生成逼真的3D场景需求日益迫切。然而，传统方法要么依赖耗时的优化过程，要么需要从资产库中检索再组装，过程繁琐且难以保证场景的物理合理性。而SceneGen框架，彻底改变了这一局面！它只需要一张普通的

AI-GitHub

AI-GitHub

241 0

蚂蚁集团开源多模态数字人：EchoMimicV3！

开源项目 10 months ago

蚂蚁集团开源多模态数字人：EchoMimicV3！

AI-GitHub

AI-GitHub

292 0

微软开源TTS 模型！VibeVoice-1.5B：可生成4人60分钟长对话音频！

开源项目 10 months ago

微软开源TTS 模型！VibeVoice-1.5B：可生成4人60分钟长对话音频！

AI-GitHub

AI-GitHub

341 0

群核科技开源SpatialLM 1.5：文本指令生成可交互的3D室内空间设计

开源项目 10 months ago

群核科技开源SpatialLM 1.5：文本指令生成可交互的3D室内空间设计

AI-GitHub

AI-GitHub

445 0

马斯克开源Grok 2.5，同时预告6个月后开源更强大的Grok 3！

开源项目 10 months ago

马斯克开源Grok 2.5，同时预告6个月后开源更强大的Grok 3！

AI-GitHub

AI-GitHub

277 0

字节跳动开源Seed-OSS模型，512K上下文刷新开源纪录！

开源项目 10 months ago

字节跳动开源Seed-OSS模型，512K上下文刷新开源纪录！

AI-GitHub

AI-GitHub

206 0