字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

AIbase基地

发布了 11569 文章

在近期的人工智能视频生成领域，字节跳动（TikTok 的母公司）悄然发布了一款名为 Seedance1.0的新模型，该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。Veo3以其音频合成和电影级工具而受到广泛关注，但 Seedance1.0的技术实力却令人刮目相看，成为视频生成的领头羊。

Seedance1.0的研究论文中详细介绍了该模型的创新之处。字节跳动的团队通过对空间和时间层的解耦，结合了多模态位置编码，从而使得该模型能够同时处理文本到视频和图像到视频的生成任务。这样的方法支持复杂的场景切换和多镜头叙事，保持了一致的主题表现。

此外，Seedance1.0的性能离不开字节跳动强大的数据管道。团队精心构建了一个大规模、多来源的数据集，配有详细的双语注释和丰富的动作与静态特征标注，确保生成内容的准确性。同时，采用了一种新颖的强化学习设置，结合了三个奖励模型，重点关注基础对齐、动作质量和美观度。

在评测中，Seedance1.0在多个维度上超过了 Veo3。在与电影导演合作开发的 SeedVideoBench 基准测试中，该模型在遵循提示和动作真实感方面取得了更高的分数。在图像到视频的任务中，Seedance 保持了输入帧的视觉一致性，而 Veo3则在某些情况下出现了光照和纹理的变化。

在推理性能方面，Seedance1.0也表现出色。该模型能够在41.4秒内生成一段1080p 的五秒视频，这一速度远超其他竞争对手，如 Sora、Runway Gen-4和 Veo3。字节跳动还表示，他们在降低成本和延迟方面取得了重大进展，使得视频生成向实时应用的目标迈进了一步。

Seedance1.0计划于2025年6月集成到 Doubao 和 Jimeng 等平台，旨在显著改善专业工作流程和常规创作任务。虽然 Veo3因首次结合了真实视频与环境音效和对话而备受瞩目，但 Seedance1.0在视觉保真度、运动稳定性和叙事连贯性方面表现更为出色，虽然在音频能力上有所欠缺。

划重点:
🌟 Seedance1.0的发布超越了谷歌的 Veo3，成为视频生成技术的新标杆。
⚙️ 该模型通过多模态位置编码实现了复杂的场景切换和多镜头叙事。
⚡ Seedance1.0在生成速度和视觉一致性上表现优异，有望在2025年成为专业创作的重要工具。

登录账号

字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

Runway APP

AIbase基地

评论 (0)

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

登录账号

​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

Runway APP

AIbase基地

评论 (0)

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

为您推荐

字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3