LongCat-Video – 美团开源的视频生成模型

# AI工具,# AI项目和框架 AI视频

LongCat-Video – 美团开源的视频生成模型

AI中国

AI中国 8 months ago 192 阅读

4.8 (1280评分)

LongCat-Video是什么

LongCat-Video是美团LongCat团队开源的136亿参数的视频生成模型，在文本到视频（Text-to-Video）、图像到视频（Image-to-Video）和视频续写（Video-Continuation）等任务上表现出色，尤其擅长高效生成高质量的长视频。模型通过多奖励强化学习优化（GRPO），在内部和公共基准测试中展现出与领先开源视频生成模型及最新商业解决方案相当的性能。

LongCat-Video

LongCat-Video的主要功能

长视频生成：在视频续写任务上进行了预训练，能生成几分钟长的视频，不会出现色彩漂移或质量下降。
多任务统一架构：将文本到视频、图像到视频和视频续写任务统一在一个视频生成框架内，仅需一个模型即可完成所有任务。
高效推理：通过粗到细的生成策略以及Block Sparse Attention技术，能够在几分钟内生成720p、30fps的视频。
多奖励强化学习优化：借助多奖励Group Relative Policy Optimization（GRPO），在内部和公共基准测试中展现出与领先开源视频生成模型及最新商业解决方案相当的性能。

LongCat-Video的技术原理

统一架构：采用单一视频生成框架，整合文本到视频、图像到视频和视频续写等多种任务，通过共享模型架构和参数，实现对不同任务的高效处理。
长视频生成技术：在视频续写任务上进行预训练，利用特定的训练策略和算法，使模型能够生成持续几分钟的长视频，同时保持视频内容的连贯性和质量稳定性。
高效推理策略：运用粗到细的生成策略，先生成视频的粗略框架，再逐步细化细节，结合Block Sparse Attention技术，提高模型在高分辨率视频生成时的推理效率，缩短生成时间。
多奖励强化学习优化：借助多奖励Group Relative Policy Optimization（GRPO）方法，对模型进行优化训练，使其在文本对齐、视觉质量和运动质量等多个维度上达到更好的性能表现，提升生成视频的整体质量。

LongCat-Video的项目地址

项目官网：https://meituan-longcat.github.io/LongCat-Video/
Github仓库：https://github.com/meituan-longcat/LongCat-Video
HuggingFace模型库：https://huggingface.co/meituan-longcat/LongCat-Video

LongCat-Video的应用场景

内容创作：帮助创作者快速生成视频素材，如广告视频、短视频、动画等，提升创作效率。
视频续写：为现有的视频片段生成后续内容，用于故事扩展、视频编辑等场景。
教育与培训：生成教学视频、演示视频等，辅助教学和培训过程，增强学习体验。
娱乐与游戏：在游戏开发中生成动态场景或角色动画，提升游戏的视觉效果和沉浸感。
智能客服与虚拟助手：生成视频回应，为用户提供更直观的交互体验。
创意设计：辅助设计师进行视频概念设计，快速呈现创意想法。

评分

4.8 (1280 人评分)

Comment (0)

Recommended Articles

OmniVinci – NVIDIA推出的全模态大语言模型

OmniVinci – NVIDIA推出的全模态大语言模型

7 months ago • AI视频

SAIL-Embedding – 抖音联合港中文推出的全模态嵌入模型

SAIL-Embedding – 抖音联合港中文推出的全模态嵌入模型

7 months ago • AI视频

FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型

FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型

7 months ago • AI视频

NavFoM – 银河通用推出的环视导航基座大模型

NavFoM – 银河通用推出的环视导航基座大模型

7 months ago • AI视频

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0 seconds ago • AI视频

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

7 months ago • AI视频

讯飞星火X1.5 – 科大讯飞推出的深度推理大模型

讯飞星火X1.5 – 科大讯飞推出的深度推理大模型

7 months ago • AI视频

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

7 months ago • AI视频

Popular Tags

产品摄影科技巨头动态 MetaConnect UI 设计 SecureAgenticAutofill ChatPPGD 软件测试中科闻歌慈善组织 PPT神器

Popular Authors

AI中国

AI中国

11569 Articles 95.03万 Followers

钛媒体APP

钛媒体APP

1489 Articles 0 Followers

IT之家

IT之家

1221 Articles 5.64K Followers

人人都是产品经理

人人都是产品经理

1210 Articles 5.87万 Followers

AIbase基地

AIbase基地

1093 Articles 9.63万 Followers