Midjourney操作界面

快手发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型

IT之家 4 月 15 日消息,快手今日举行“灵感成真”可灵 AI 2.0 模型发布会,并宣布基座模型再次升级,面向全球正式发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型。据介绍,可灵 2.0 模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图 2.0 模型在指令遵循、电影质感及艺术风格表现等方面显著提升。快手高级副总裁、社区科学线负责人盖坤透露,自去年 6 月发布以来,可

IT之家 4 月 15 日消息,快手今日举行“灵感成真”可灵 AI 2.0 模型发布会,并宣布基座模型再次升级,面向全球正式发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型。

据介绍,可灵 2.0 模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图 2.0 模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

快手高级副总裁、社区科学线负责人盖坤透露,自去年 6 月发布以来,可灵 AI 已累计完成超 20 次迭代。截至目前,可灵 AI 全球用户规模突破 2200 万,过去的 10 个月里,其月活用户量增长 25 倍,累计生成超过 1.68 亿个视频及 3.44 亿张图片。

盖坤介绍称,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵 2.0 对比谷歌 Veo2 的胜负比为 205%,对比 Sora 的胜负比达 367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。

基于 MVL 理念,可灵 AI 正式推出多模态编辑功能。“从今天起,大家可以在可灵 AI 的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述词)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

全新的可灵 2.0 大师版在语义响应、动态质量、画面美学等方面显著提升生成效果。可灵 2.0 大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

图片

据官方介绍,当前图生视频约占到可灵 AI 视频创作量的 85%。在图像生成大模型领域,快手的可图 2.0 处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于 Midjourney V7、FLUX1.1 [pro] 以及 Reve 等行业领先的图像模型,均保持明显优势。

可图 2.0 文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图 2.0 可支持 60 多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。

同时,可图 2.0 也上线了实用的图像可控编辑功能 —— 局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图 2.0 还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。

IT之家附快手可灵 2.0 模型官方地址:

https://app.klingai.com/cn/

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部