产品评测 10 hours ago 198 Views 0 Comments

谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

AI中国
AI中国

Published 10145 Articles


谷歌这只「香蕉」火得有些疯狂:Nano Banana(即 Gemini 2.5 Flash Image)自 8 月底上线以来,仅用几周就吸引了超过 1,000 万新用户,并在 Gemini 应用中完成了 2 亿次图像编辑请求


数据的飙升速度,几乎可以用「离谱」来形容。


就在大家还沉浸在谷歌新推出的 Nano Banana 引发的视觉狂潮中时,短短一周,字节跳动就在旗下各个平台推出了全新升级的 Seedream 4.0 ,紧追其后。


我们似乎能看到 2 个 AI 大厂的「隔海斗法」。


为了更直观地体验两款模型的差异,我特地跑去「巡查」自己订阅的各大会员平台,想找一个能同时用上 Nano Banana 和 Seedream 4.0 的地方。


结果发现,Lovart 动作最快,不仅第一时间同步上线了两款模型,还贴心地推出了一整套优惠活动(具体内容我们会在文末总结)。


接下来,就结合我们准备的一系列实测案例,带大家看看 Lovart 如何在一个平台里无缝串联这两款 SOTA 模型。


它们在风格特点、能力边界和适用场景上究竟有哪些不同。


黑客松海报艺术风格转换


Nano Banana 和 Seedream 4.0 虽然在图像编辑、生成能力上都非常出色,但在一些垂直场景中的呈现,还是能感受到微妙的差异。


比如我们先来看一个具体案例。


AI Hacker House 联合「十字路口」在 8 月 29 日发布了一张黑客松海报。整张海报元素非常复杂:既有 3D 感的线条,又有鲜艳的色彩和层叠的结构,但整体观感却非常协调,视觉冲击力也很强。



看到这张图,我心里就冒出一个想法:能不能直接让 Lovart 的一站式生成能力,帮我把同一张海报转换成多种艺术风格?


这样就不用一张一张去「抽卡」,效率更高。


于是我尝试了一个非常简单的提示词:


将我上传的图片,转换艺术风格


也是我测试 Nano Banana 和 Seedream 4.0 的一个重点:它们是否能够在轻提示下就表现出足够的创造力和一致性。


先来看看 Nano Banana 的表现,Nano Banana 在执行时,几乎没有偏离我的原始设定。


它给出的结果往往忠于提示词,替换或转换的精度很高,风格的边界也很清晰。比如在处理色彩和轮廓时,它会保持整体结构的稳定性,生成的画面更像是「在原有设计上微调」,而不是彻底重塑。






相比之下,Seedream 4.0 的结果更像是「在原图基础上进行艺术发散」。


它会尝试引入新的笔触质感、不同的色彩氛围,甚至局部构图上也会做一些微创新。最终的效果可能没有 Nano Banana 那么「精确」,但往往更具艺术感和惊喜感。











整体来看,Nano Banana 更倾向于精准完成任务,而 Seedream 4.0 更像是在给结果「加点料」,带来额外的艺术张力。


如果你追求的是「尽量忠实于原图」的精确风格转换,Nano Banana 会更让人安心一点;但如果你希望结果中带点「意外的灵感」,Seedream 4.0 会显得「更香」。


一句话生成数十套时尚杂志封面


如果说黑客松海报测试更偏重于「复杂元素的整体艺术风格转换」,那么接下来的实验,就更贴近实际创作者的需求了:快速生成不同风格的时尚杂志封面。


这次我邀请了熟悉的「模特」:Koji 老师来担当主角。


下面这张图,就是我选定的主参考图:



为了让实验更贴近真实杂志,我随手在 Google 上截了几张图片:一部分是 Vogue 封面,另一部分则来自 芭莎男士


这些作为风格参考,非常适合拿来做替换测试。



在 Lovart 中,我输入的提示词依旧非常简单,几乎就是一口气把需求讲清楚:


让图一的男士,替代图二(Vogue 或者 芭莎男士)中每一张小图,给我 XX 张图片


就是这样一句话,Lovart 就能帮我同时调用模型完成批量生成。


实际结果一出来,差异还是比较明显的。左侧为 Nano Banana,右侧为 Seedream4.0.


Nano Banana 在整体构图和风格替换上比较稳定,但在涉及到中文文字时,它会显得吃力一些。比如封面上常见的杂志标题、排版里的小字,有时会生成得模糊甚至错位。


Seedream 4.0 则在中文场景里更得心应手,封面上的汉字不但清晰,而且风格也很贴合。尤其是在版式较复杂的情况下,它几乎不用「抽卡」就能给出可直接使用的成品。



Nano Banana



Seedream 4.0


下面是 Nano Banana 的表现,可以看到,整体风格感很到位,尤其是模特的脸部替换十分自然。在细节文字的保真度上,也很不错。




接下来则是 Seedream 4.0 的表现。


在中文场景下,尤其是图片内部不涉及那么多字数的情况下,Seedream4.0 的表现可以说几乎不用抽卡。


整体来说,Seedream 4.0 在封面类任务中更像一个「排版助理」,对中文的兼容性非常好,不仅能处理大标题,就连小字的版式也能还原得很流畅。









总结一下,如果你需要做国际风格的封面,且对中文排版要求不高,Nano Banana 已经能给到非常干净的替换效果。但如果你要直接做中文杂志的 Mockup(甚至可以直接商用),Seedream 4.0 基本可以实现「开箱即用」。


当然,如果出现太多文字的话,也仍然会出现一些幻觉,这时候则需要一些「抽卡」。


AI Hacker House Logo × 地标建筑融合


在时尚封面之外,我还想看看两个模型在多元素融合方面的表现。毕竟,现实创作者经常需要把 Logo、地标建筑、活动主题等元素揉合到一张图里,而不仅仅是单一风格的替换。


比如说,下个月「十字路口」团队计划在新加坡举办一场 AI 开放麦活动。


我找了两张参考图:一张是 AI Hacker House 的 Logo,另一张是我用 AI 生成的新加坡地标建筑元素图。




然后,我试着将它们融合。同样提示词很简单,而且在 Lovart 上,你可以直接在一句话中,同时分别调用 2 个模型,就像我的提示词这样:

将 2 张参考图融合,Title 为 AI Hacker House X Singapore,英文用 Nano Banana,中文用 Seedream 4.0。


下面这些,就是我在第一轮 roll 出来的海报:







可以看到,两张参考图的要素都被很好地保留下来,Logo 和地标融合得比较自然。但因为我没有额外加上艺术风格要求,所以画面看起来略显「平淡」,更像是一份草图。


然后,我就开始进行了一系列「微操」。


接下来,我开始在同一上下文窗口里继续上传图片和追加提示。这里我感受到了 Lovart 的进化


【1】它能够清楚地分辨出提示词中不同部分的优先级。


【2】即使我没有切换上下文,它也能记住前文逻辑,把新图的风格应用到指定模型。


【3】它会轮换着用 Nano Banana 和 Seedream4.0 生图。


比如我上传了这张新图:



Lovart 仍然能够「聪明」地将这张图片的风格,经过思考和解析后,独立地分配给 Nano Banana 和 Seedream 4.0,它甚至能够调用 Nano Banana 生成一张图片,然后再用 Seedream 4.0 做一张图片。


2 个模型生成的结果如下。


先看看 Nano Banana 的表现:






Nano Banana 依旧保持了简洁、直接的风格。它会尽可能清晰地完成「融合」这件事,不做过多修饰。最终效果偏干净、规整、好看。


然后,则是 Seedream 4.0 的表现:





其实很明显,Nano Banana 更加「崇尚」简洁高效地完成任务,而 Seedream4.0 则会有意识地去运用更多复杂的元素。


Seedream 4.0 的结果则带有明显的艺术加工痕迹。它会主动加入光影、纹理或色彩渐变,让画面更具氛围感,海报感更强。


高定服装试穿


在海报和封面测试之后,我想尝试一个更贴近日常生活、也更能直观感受 AI 创意能力的场景:虚拟试衣间 + 化妆间


首先,我 AI 做了一张美女的视觉图,作为主要参考图:



然后,从网上随手找来一堆明星舞台高定服装:



随意输入提示词:


让图一的女士,试穿图二中每一张小图的明星高定服装,给我 9 张图片


结果出来后,9 张图有 5 张用 Nano Banana 生成,4 张用 Seedream 4.0 生成。两者的一致性都很高,整体观感非常自然,服装的褶皱、贴合度甚至光影效果,都很真实。











这些图片当然看不出来 Nano Banana 和 Seedream 4.0 的区分度,但确实表明这 2 个模型的基础能力都相当不错。


虚拟妆容 + 手帐教程


进一步地,服装之后,我又把挑战升级到妆容上。我从网上随意找来了一张 16 种妆容的图片:



让 AI 模特依次尝试。下面这一组结果,第一排是 Seedream 4.0,第二排是 Nano Banana



辣妹妆



千金妆



华丽女主妆



韩式白开水妆



日系甜美妆



森系仙女妆


你能看得出来,在风格浓厚的妆容上 Seedream 4.0 表现的较为得心应手,而 Nano Banana 其实更适合淡妆(当然,我并不是内行,请各位女读者们在评论区评价下,2 个 AI 化妆器的表现究竟如何)


再进一步地,由于 2 个模型的视觉推理也都还不错,所以我还让 Lovart 进一步生成了 妆容教程手帐。这里我设定:英文由 Nano Banana 生成,中文由 Seedream 4.0 生成。






这样就很明显了,在英文和中文 2 种语言里,这 2 个模型相比半年前的上一代 AI 图片生成模型,在文字输出上的幻觉表现,提升的非常大。


两个模型在图文结合的任务里,幻觉率已经大幅下降,无论是中文还是英文,都能把步骤和视觉图匹配得很流畅。


在体验了这么多案例之后,我本来以为积分肯定要消耗得差不多了。毕竟一路下来,几乎是“海量生成”,尤其是杂志封面和妆容测试,少说也得几十上百张图。


结果,当我从 Project 页面退出来时,却发现积分消耗竟然是 0。这让我一度怀疑是不是系统出 bug 了。


优惠活动


最后的最后,我玩了这么多案例,玩到头昏眼花,本以为积分所剩无几,然而从 Project 页面退出来后,才发现,积分消耗是 0 !


但查了一下才知道:原来 Lovart 近期在搞活动,尤其是这次我重点测的 Seedream 4.0 和 Nano Banana,从 9 月 10 日到 9 月 20 日 都是免费开放的。更惊喜的是,如果你在 20 号之前开通 Basic 及以上会员,那么在整个会员期间,这两个模型都可以 365 天无限量 0 积分使用


换句话说,如果你正好在这段时间开通会员,就相当于一年内随便玩,不用担心积分消耗的问题。对于喜欢做实验、批量生成的用户来说,这个优惠确实比较值。


更妙的是,我还顺手瞥了一眼其他模型:


【1】谷歌的 Veo 3 也在打折,居然是全系 3 折优惠


【2】可灵、海螺 在 9 月 20 日之前,Pro+ 会员都可以无限畅用。


所以我干脆马不停蹄,把这一路生成的图,利用 Lovart 的 ChatCanvas 功能,使用 Veo 3 帮 Koji 做了 2 个转场小视频,又拼合了起来。



如果说前面几章是技术和艺术上的对比,那么最后这个福利,算是对所有创作者的「现实关怀」。因为创作本身就已经足够烧脑了,如果还能在成本上轻松一点,那就更容易让用户专注在作品上。


这一路下来,从黑客松海报到时尚杂志封面,从 Logo 与地标融合到虚拟试衣间和化妆教程,我基本把 Nano Banana 和 Seedream 4.0 两个模型在 Lovart 里的主要能力都体验了一遍。


最大的感受有三点:


【1】基础能力已经非常扎实


不论是 Nano Banana 还是 Seedream 4.0,在面对复杂提示、长上下文、多元素融合时,都展现出了远超半年前的稳定性和一致性。幻觉率明显下降,图文匹配也顺畅很多。


【2】风格倾向各有特点


Nano Banana 更像「执行型选手」:注重精确、简洁和一致性,尤其适合需要保持严谨结构的任务。


Seedream 4.0 更像「设计型选手」:在艺术发散、浓烈风格和中文排版上更有优势,生成结果往往带点小惊喜。


【3】Lovart 的体验感是加分项


不仅能一句话调用多模型,还能在长上下文里「记住」我的意图,甚至能自动帮我分配任务。用一句话形容就是:它不是在「执行指令」,而是在「理解设计」


更让人开心的是,这次体验几乎没花积分,还意外发现了不少活动优惠。


从这次测评来看,我能感觉到一个趋势:AI 图片生成已经逐渐从「实验室里的酷炫技术」,走向「普通人也能随手用」的生产力工具。


未来,它可能会进一步细分:一部分模型继续往高精度、低幻觉方向演进;另一部分则在艺术性、创造力上不断突破,像真正的合作者一样,和创作者共同完成作品。


Nano Banana 和 Seedream 4.0 就正好站在这两个方向的交叉点,各自延伸。


看完这次测评,你更喜欢哪种风格?欢迎在评论区聊聊,你的使用场景和体验感受!





文章来自于微信公众号 “十字路口Crossing”,作者 “十字路口Crossing”

AI中国

AI中国

10145 Articles 1762244 Views 950300 Fans

Comment (0)

睡觉动画