B站团队推出AniSora开源动漫视频生成模型，一键打造多种风格动画！

AIbase基地

发布了 11569 文章

近日，B 站（哔哩哔哩）团队在5月12日正式开源了一款名为 AniSora 的动漫视频生成模型。这个新工具使用户能够一键创建多种动漫风格的视频片段，涵盖系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫宣传片以及鬼畜动画等类型，丰富了动漫创作的可能性。

B 站团队指出，虽然目前市面上已经有 Sora、Kling、CogVideoX 等多款自然视频生成模型，但在动漫视频领域，现有技术仍显不足。动漫以其独特的艺术风格、夸张的动作和对现实物理规律的突破，给视频生成带来了不小的挑战。因此，AniSora 的推出，将填补这一领域的空白。

AniSora 项目包含了一整套的系统，主要由以下几个部分构成:首先是数据处理流水线，该模型训练使用了超过1000万条高质量的数据;其次，AniSora 引入了可控生成模型，加入了时空掩码模块，支持多项关键动画制作功能，比如图像生成视频、帧插值和局部图像引导等;最后，团队还收集了948段多样化的动画视频，建立了评测数据集，经过双盲实验及 VBench 测试后，得出人物一致性与运动一致性均达到了当前的最高标准（SOTA）。