
B站团队推出AniSora开源动漫视频生成模型,一键打造多种风格动画!
近日,B 站(哔哩哔哩)团队在5月12日正式开源了一款名为 AniSora 的动漫视频生成模型。这个新工具使用户能够一键创建多种动漫风格的视频片段,涵盖系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫宣传片以及鬼畜动画等类型,丰富了动漫创作的可能性。B 站团队指出,虽然目前市面上已经有 Sora、Kling、CogVideoX 等多款自然视频生成模型,但在动漫视频领域,现有技术仍显不足。
近日,B 站(哔哩哔哩)团队在5月12日正式开源了一款名为 AniSora 的动漫视频生成模型。这个新工具使用户能够一键创建多种动漫风格的视频片段,涵盖系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫宣传片以及鬼畜动画等类型,丰富了动漫创作的可能性。
B 站团队指出,虽然目前市面上已经有 Sora、Kling、CogVideoX 等多款自然视频生成模型,但在动漫视频领域,现有技术仍显不足。动漫以其独特的艺术风格、夸张的动作和对现实物理规律的突破,给视频生成带来了不小的挑战。因此,AniSora 的推出,将填补这一领域的空白。
AniSora 项目包含了一整套的系统,主要由以下几个部分构成:首先是数据处理流水线,该模型训练使用了超过1000万条高质量的数据;其次,AniSora 引入了可控生成模型,加入了时空掩码模块,支持多项关键动画制作功能,比如图像生成视频、帧插值和局部图像引导等;最后,团队还收集了948段多样化的动画视频,建立了评测数据集,经过双盲实验及 VBench 测试后,得出人物一致性与运动一致性均达到了当前的最高标准(SOTA)。
为了让公众更好地理解 AniSora 的强大功能,B 站还分享了一系列生成视频的示例。比如,在一段视频中,一个角色坐在一辆行驶的汽车上,随风而动的头发展现出自然的动态;另一段中,两位身穿红色婚服的人物手持红绳缓缓走向远方;而在第三段中,金发角色伸手轻触跪着的人物,展现出细腻的情感表达。
AniSora 的开源地址已在 GitHub 和其他平台发布,感兴趣的开发者和动画爱好者们可以前往查看和使用。随着这一技术的推出,未来我们或许能在创作和观看动漫内容时,体验到更多创新与惊喜。
发表评论 取消回复