AI热点 1月前 169 浏览次数 0 评论

一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。

发布了 7995 文章

人在火山引擎发布会现场,会上令人头晕目眩的发了一堆东西。


豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型,以及端到端语音模型等等。


火山还是火山,真的,储备实在太多了。


其中大部分都写过了,比如语音播客模型,就是前几天我写的扣子的AI播客,底层就是这个。


而这次,我觉得比较新的,最酷的,还是这个视频生成模型Seedance 1.0 pro。



这玩意前几天屠榜了,虽然名字不一样,但其实就是一个东西。



当时榜单一出,很多朋友立刻就坐不住了。


好多金融的朋友的也第一时间跑来问我。



不过我也不好说啥= =说啥都是泄密。


其实我上周末,就拿到了这个模型的内测,就是即梦AI上的视频3.0 Pro。



已经爽玩了几天了。


之前很火的即梦AI 视频3.0,其实就是Seedance 1.0 lite,即梦AI 视频3.0的评测可以看之前汗青写的:一手实测即梦AI视频3.0,质量全面提升,极致性价比的六边形战士


而这次,即梦AI视频3.0 pro,也就是Seedance 1.0 pro,我也测了一堆case,先说结论:


跟汗青的评价一样,更水桶更纯粹的六边形战士。


我也放出我的评测,希望能给到你们一些,对于Seedance 1.0 pro的客观认知。


话不多说,正式开始。


这次测评,我总共分了这么几个维度:


1. 多镜头组合


2. 运动质量


3. 情绪表演


4. 运镜


5. 物理动态效果


6. 风格化


一个一个来说。


一. 多镜头组合


这也可以算是字节视频模型一贯的特色了,可以直接在视频中切换分镜。


比如我有这么一张图。



我就给他写了一段Prompt:


狮子穿绒面西装坐在敞篷老爷车内,镜头从侧前方仰角缓缓逼近,他稳坐驾驶位,头微微偏向镜头方向,风吹起鬃毛,阳光强烈,墨镜反射出云影与废土景色,他一动不动,像在等某个信号。
镜头切换。
镜头切至车内俯拍,狮子抬手慢慢摘下墨镜,眼神直视镜头,手指敲打方向盘,背景响起远处引擎声,他轻抿嘴角,缓缓转头望向远方公路尽头,轻声说了一句台词:「他们终于来了。」
镜头切换。
镜头拉远至正后方低位跟拍,车启动、尾气喷出,他缓慢驶离镜头,背影渐远,前方云层压低,天空突变,镜头最后定格在一块路牌上:WELCOME BACK, KING.


这里其实能看出来,我用了两次镜头切换,“镜头切换”就是触发词,你写进去以后,就能直接在视频中切镜。


我们看看Seedance 1.0 pro的生成效果。



这个语义理解能力有点离谱了,我在Prompt里面写的几乎在这10s里面,全都实现了,最最离谱的是。


我的结尾,写到,镜头最后定格在一块路牌上:WELCOME BACK, KING。



我知道,这个字稍微有点错误,有点乱码,但是不妨碍,它听懂了我的话,这个路牌,是真的给我生成出来了,而且文字,是真的在尝试生成,虽然没有即梦图片3.0那么完美的准确,但是我相信,给字节时间,这都不是问题。


还有一个我很喜欢的猫。


再加上Prompt:


一只橘猫坐在金色地毯上,缓慢睁眼,睫毛微颤,镜头缓慢前推。镜头切换。特写镜头,猫抬爪按下地毯边缘一块砖,地面机关咔哒响起。镜头切换。全景镜头,周围蜡烛同时熄灭,背后石壁缓缓打开,一道亮光射入。



非常完美,文生视频也可以,用了一段之前藏师傅的Prompt:


一系列快速变换的动态镜头:运动员在烈日下奔跑,大汗淋漓,汗珠从额头滴落;冲浪者乘风破浪;一群年轻人在户外音乐节上兴奋地跳跃。特写镜头显示冰镇饮料被打开,气泡升腾。最后,几个人举杯祝酒,脸上洋溢着满足而充满活力的笑容。



二. 运动质量


这次Seedance 1.0 pro的运动质量也在第一梯队。


第一个出场的是大嘤著名硬汉邦德。


提示词非常简单:男人瞄准目标,举枪,开火。



拉栓,举枪,瞄准,射击,一套动作非常行云流水。


开火那一瞬间的后坐力,和映在脸上的火光,也很真实,这部分其实属于物理规律测评的范畴,不过,是优点,就先拎出来夸一夸。


然后是这个非常抽象的,骷髅跳踢踏舞。


虽然只剩骨头架子,但动作幅度还挺大,挺有劲儿,虽然这舞跟我跳的有的一拼。



认认真真看,这哥们儿也比较争气,哪哪儿都没有崩。


还有两哥们一起吃煎饼,如果不知道的,可能还以为是某部复联电影里的。



还有最难的,运动。


提示词:一个男人跑步运球,投篮,镜头跟随男人。


十秒的时间,无论是运球还是跑步,都没有出错,很稳定。


唯一要吐槽的就是,投篮没投进去。不过至少是符合物理规律的,不像有些AI,为了把球投进去,使出了不知道多少邪术,牛顿的棺材板都要压不住了。



然后是踢足球。


提示词:球员脚法熟练地带球过人,动作流畅,运动镜头跟随人物。


带球过人体现不够明显,阻拦的人只是在前景里晃了一下。不过除此之外,运动员的动作很稳。



三. 情绪


这部分最重要的是让大家沉浸式感受,所以我就多放case,少说两句。


一个我很喜欢的镜头,跑着跑着就哭了,感同身受。



女孩看向镜头,微笑。



心事重重的孩子,看着车窗外。



恐惧,瞳孔放大。



女孩流下眼泪。



拳击手被打倒,仍然不屈地站起来。



好奇的小比格犬。



让我印象最深的其实是这个case,我告诉模型,这个宇航员氧气要耗尽了,地球就在眼前,但他回不去。


这是Seedance 1.0 pro给我的两种表演方式:


第一种,很克制,没什么大的表情。嘴角微微一笑,看起来像是回忆起了人生中某一段难忘的经历,又像是因为缺氧而恍惚,就要命不久矣。



第二种,沉浸式体验什么叫喘不上气。大口呼吸,满满的求生欲。镜头一切,窗外,马上就到地球了,就差这么一口气。这可不得急吗,我都替他急。



真的,就看什么AI的表演,能搞个奥斯卡玩玩了。


四. 运镜


其实运镜在前两块也有涉及,不过这块,我们搞得更纯(炫)粹(技)一点。


360度环绕一下。



再环一下。



航拍一下。



再追个车。



这平稳度,感觉已经可以把Seedance 1.0 pro当无人机使了。


五. 物理动态效果


这部分考验的主要是Seedance 1.0 pro能不能压得住牛顿他老人家的棺材板。



这段视频,涉及到马匹奔跑、蒸汽朋克齿轮运转、水花溅起、毛发飘动的要素。


每个要素单拎出来说,都容易出问题。


但是这段视频,除了马背上的鬃毛稍微有些僵硬,我挑不出别的毛病了。


地球上的物理规律太简单了,我们再上点难度,太空物理。



还行,牛顿没什么意见。


水下来一个。



头发和衣服的漂浮、水中泡沫、水底波纹,都很符合真实世界规律。


涂口红,皮肤的张力非常的真实。



骑摩托的效果也很丝滑。



包括延时摄影效果。



爱情片桥段里经常出现的一起捏陶罐,现在也能做了。


而且很搞得是,捏陶罐最重要的不是陶罐,而是肢体接触,这俩人的手,从头到尾就没撒开过。



六. 风格化


即梦的风格化一致性,一直是我觉得做的最好的,没有之一。


这是特定风格下的一致性效果:


男人放下枪,掏出一块面包,吃了起来。



对比前面,邦德那是真硬汉,这个年轻人带了点儿别的情绪,像第一次上战场手足无措的孩子。


就真的,挺细腻的。


还有之前我短视频里做的像素化,只有Seedance 1.0 pro,能很好的roll出来。



动漫风格,双手不断的在水中挣扎。镜头切换,特写,男主恐惧的双眼。



很有风格特点的两个插画风格。




写在最后


以上,相信大家看完,对于Seedance 1.0 pro已经有一个比较清晰的认知了。


可以说,Seedance 1.0 pro这个新晋榜一大哥确实不虚,角色动作、表情和情绪、物理规律、运镜能力、风格一致性、语义理解上没有短板,都处于第一梯队领先水平。


而且在体育运动、表情和情绪处理、风格一致性方面,还经常会给到人惊喜。


感觉,Seedance 1.0 pro要在榜上盘踞一段时间了。


当然,其他友商也不会闲着,都在虎视眈眈。


AI视频,确实越来越卷了。


说白了,卷来卷去,最终被利好到的,还是我们这群用户。


现在,火山引擎也把Seedance 1.0 pro开放给了企业用户。大概每5s的1080P的视频价格是3.67元。



也将于今日在豆包App全量上线,打开豆包App对话框,选择“照片动起来”,输入文字指令或上传图片,就能体验了。



所以,卷点好啊。


其实,还是很感慨的。


作为从runway时代就开始玩AI视频的人,这两年见过很多很棒的AI视频产品,有些名噪一时,却逐渐掉队。


有些不声不响,一直默默追赶。有些出道就惊艳世人,还在勇攀高峰。


希望榜单里,常看到国产模型的名字。


惟愿。


国运昌隆。


文章来自于“数字生命卡兹克”,作者“卡兹克、水杉”。


7995 文章 1244368 浏览次数 950300 粉丝

评论 (0)

睡觉动画