AI热点 12小时前 111 浏览次数 0 评论

2025上半年,我的常用AI绘图工具盘点

AI中国
AI中国

发布了 7847 文章



嗨大家好!


上次我的好基友一泽@一泽Eze 写了非常详细全面的半年度总结,当时他问我要不要写,我随口一说真不错啊我也准备写。


然后被他催稿了半个月哈哈哈。


关于今年上半年AI模型和产品,看他这篇万字盘点2025上半年,值得推荐的AI模型与产品清单一定能有很多收获!虽然一泽更新得不太频繁,但只要他写的,都是高质量的好内容。


今天我主要还是从我自己常用的工具进行盘点。我会简单分成三个部分:AI 绘图、AI 视频,以及AI 效率工具(AI Agent也归于此类)进行盘点。不过写完AI绘图相关后意识到这个可能会是个大长篇,那么我就分成两篇或者三篇进行了。今天是上篇,AI绘图类。


另外,我按照一泽当时问我的格式,按照这四个维度回答:最常用 / 有惊喜 / 有印象 / 日常推荐


叠甲:以下均为我个人的尝试、体会和总结的分享,不一定完全准确,每个人的体会不同。我提到的产品或工具不一定是最好的,没有提到的也不代表不好,我们每个人对工具的具体需求和期待都是不同的。


先说明一下,我这次是按工具来盘点的,不是按AI模型。

AI图像生成与编辑最常用:Midjourney、即梦、ChatGPT 4o

有惊喜:豆包超能创意1.0/2.0、Flux 1.0 Kontext、ComfyUI

有印象:Reve、Recraft、Ideogram

日常推荐:Midjourney、即梦、豆包、星流


了解其他工具可以看这个(时间比较久部分信息可能有变动➡️ 爆肝整理国内AI生图工具免费指南,亲测好用工具+图片效果对比图! )1.最常用

1.1Midjourney·视觉质感王者


网址👉 https://www.midjourney.com/imagine


Midjourney 依然是我上半年使用最频繁的AI绘图工具,在创意和视觉效果方面还保持行业领先地位。


Midjourney 的创意激发能力依然遥遥领先,我能切身体会到 V7 版本的质感比 V6 系列有所提升,但是偶尔会觉得有点过度了,会切回 V6 系列继续跑图。Midjourney 除了真实感人物现实图像,也很擅长各种创意插图和幻想场景、各种材质表现效果,被津津乐道的就是它的美感。V6/V7 的风格化代码依然非常好玩,能轻松产出风格一致并且独特的图片。放大和扩图的效果也非常好。


题外话,Midjourney 的 V1 视频模型发布后,图片转视频更方便了,视频效果也不差(但视频画质目前 480P 没有优势)。


但 Midjourney 的几个缺点依然很明显,提示词遵循度一般,“脑补”功力强,精确控制能力还有局限。图片中的文字生成效果差(中文不支持,英文也不算理想)。另外,始终对中国元素有误会,亚洲人物风格都比较日系韩系,如果直出中国人物,面孔还是有些缺乏美感。


往期相关:


1.2即梦·多功能创意平台

网址👉 https://jimeng.jianying.com/ai-tool/home


我直接大声宣布我是即梦的狂热粉!即梦是平面设计师可以多多尝试的提效好工具,对小白也友好,艺术字、中文海报生成目前无敌,人物质感提升很快,生成视觉草案、海报等的效果都可以试试,但如果要追求高画质细节的,还是要搭配后期修图和相关专业软件辅助。


即梦生图生视频对口型数字人都可以,还有画布相关功能作为补充,现在还可以在剪映和它梦幻联动,直接同步即梦生成的素材到剪映,素材使用很方便。简单打个比方,比如我们想在视频里加个贴纸/艺术字/元素的气泡效果等等,在即梦做完在剪映用。感觉被字节做局了,太好用根本停不下来!


即梦的人物质感还在持续提升,但是对即梦的人物效果我依然觉得,太好看反而觉得有些不真实,人物辨识度反而不够了。因为我对字体比较敏锐,在智能参考3.0的时段发现即梦已经在海报中使用免费商用字体了,期待继续优化,也期待海报小字细节持续改善。


往期相关:


1.3ChatGPT 4o·对话式绘图先锋

网址👉 https://chatgpt.com/?model=gpt-4o


ChatGPT 4o 绘图功能一出世就惊艳了全球,改图功能和风格迁移很不错,能无缝嵌入对话中即时生成和编辑图像,适合制作海报(英文海报效果更好,中文美感一般,但中文效果越来越好了)、插画、各种材质的小物件以及快速设计原型参考。


ChatGPT 放在 AI 生图工具中有点太超前了,主要因为它原生多模态集成,聊天就可以画图,在生成细节、语义理解、文字渲染方面质量都很高,同时可以多轮对话局部修改(但前后一致性会有所改变)。


当然缺点也突出,拼写错误和细节漏洞同样存在,生成单张图片就像拉生锈的卷闸门。原生生图刚开始可能还好,聊几轮就偏暖发黄,黄出一种出土文物般的陈旧感,下面两招土法提示词偶尔会有用:


1.保持色温6500k。

2.柔和的漫射光,带有中性或冷色调,确保纯净、无黄色调的外观。


如果就为了这个绘图功能,那我推荐直接用 Lovart 或者星流或者 Hatchcanvas 那种直接对话并且可以批量输出的设计Agent 。


往期相关:


2.有惊喜


2.1豆包·国产AI性价比之王

网址👉 https://www.doubao.com/chat/


人人都应该尝试的国民级 AI ,在中文生态下表现非常出色的 AI 绘图工具,拥有很高的中文理解能力与稳定的输出效果,尤其在摄影、电商场景和 3D 风格上表现突出质感优秀,现在超能创意2.0 修图、对话修改、批量输出和生成海报等都非常方便。


豆包核心优势在于本身用它的功能就多,功能很多也很能打,现在因为模型超强生图功能也上来了,豆包超能创意2.0 批量出图kuku能打,一次直出36张,108 好汉在豆包这里都只能走 3 轮。对话改图属实是奶奶都会用的级别,再加上反推和复刻的功能也强,最重要是(现在)它还免费。


美中不足是它在改图的多轮对话中图片质量会损耗,细节丢失变多。一致性还达不到很好,有时候需要运气和抽卡。对于高级感海报和图片的提示词有一定要求,复刻的时候也不是完全还原风格,倾向于还原它擅长的风格。(豆包:不管答案对不对,公式先套上去)


往期相关:


2.2Flux 1.0 Kontext·一致性编辑利器

网址👉 https://playground.bfl.ai/image/edit


作为 Black Forest Labs 最新推出的 AI 图像生成和编辑工具,Flux 1.0 Kontext 图像生成美感一般,真实感很好,英文文字能力强,值得一说的还是在图片编辑方面表现非常强劲,改图能力很强。


Flux 1.0 Kontext 能够理解上下文并生成和编辑图像,保持人物、物品在多场景中的形象一致,尤其适合三视图、连贯场景创作,编辑精准,风格迁移能力也好,可以多次迭代编辑。


但是多轮编辑后细节会失真并且出现图像伪影,指令过于精确或复杂的时候可能无法正确响应,同时生成结果对真实世界的知识掌握略显不足,部分复杂场景可能理解不到位。


Pro/Max 模式推理速度比传统模型快很多,但是不管在哪个平台使用基本都需要积分点数或者会员。


FLUX.1-Kontext-dev 已开源:


https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

(非商用开源,开发者在使用时需要遵守 FLUX.1 [dev] 非商业许可条款)


往期相关:


2.3ComfyUI·专业工作流必备


虽然今年以来被唱衰多次,但是我在此大胆开麦,截止到目前,要做专业的工作流,ComfyUI 依然是绕不开的最好的工具。


如果我们追求对整个图像生成过程的可视化控制、希望构建自定义工作流程、需要处理批量任务或集成多模型工具,且有一定编程思维,同时硬件支持,ComfyUI 是最好的选择。ComfyUI 通过节点拼接方式组合完整流程,灵活性和可控性远超传统图形界面工具,适合那些希望精细控制生成流程并搭建复杂工作流的用户。如果接受云端,可以考虑Liblib 等工具。


主要难度还是在于学习曲线陡峭,节点式操作近似于徒手编程,需要理解节点间的连接逻辑和数据传递流程,对新手很不友好。同时硬件还有依赖,虽然显存管理高效,但对 GPU 性能仍有要求,配置不足会导致卡顿。但是能学我还是建议大家学。


这里推荐一个教 ComfyUI 的 UP主叫 @CG迷李辰,实话说,老师除了普通话有点LN不分其他都很完美,B站搜索他的账号免费也能学很多知识,付费有个课程我买的时候200多现在也就300多,还在持续更新,他本人也还在持续答疑,有时候晚上好晚了还在群里答疑,很真诚,跟他入门 ComfyUI 是我觉得我做得最正确的决定。我和这位老师没有私交,只是单纯觉得这位老师好所以推荐给大家。


3.有印象


3.1Reve·质感胶片风首选

网址👉 https://preview.reve.art/app


生成速度快,图片质感好,主打对提示词的高效理解、画面美感与文字渲染能力。擅长胶片质感摄影图片、人文摄影、超现实表现、海报(英文),可以中文提示词输入。从名不见经传到曾经上排行榜第一,Reve 当初就是靠硬好看出圈过,另外,它支持部分知名品牌logo直出海报(这个豆包也可以),用于制作相关品牌视频的图片素材比较方便。做艺术字效果不错,但还是限英文艺术字。Prompt Enhance 功能方便写不出提示词的朋友。另外,商用权归用户,不设复杂限制,适合电商、小团队使用。


不过目前它的修改还是全图更新,没有局部编辑的功能。全景、广角、透明物体、特定角色和复杂场景表现还有欠缺。


往期相关:


3.2Recraft·设计师快乐老家

网址👉 https://www.recraft.ai/


一个适合设计师的平台,有很多设计师刚需的功能,比如支持 SVG/Lottie 矢量格式输出,图标、 logo、图案适用性强;可以上传自由风格或自己预设模板,来达到系列设计图的视觉风格统一。“5张图炼LoRA”就是它,不过这个视觉风格也没有特别统一。样机功能实用。编辑工具箱丰富,工作区简约清晰界面直观,对设计师友好。现在还内置了GPT-4o 和Flux 1 Kontext 系列模型,改图非常便捷。


它预设的很多风格用来做特定风格的插画效果很好,可以尝试。Recraft V3(说到代号 Red Panda大家可能就有印象了)曾登顶多项benchmark,提示精确度和画面质量也不错。


对于不熟悉设计工具的用户,上手时需要理解画布与编辑逻辑(用过星流或Lovart可以较快适应)。


3.3Ideogram·Logo设计好帮手

网址👉 https://ideogram.ai/


我认为是目前AI图像生成中处理英文文字最出色的工具之一,适合海报设计、Logo设计、工业设计、首饰设计等场景。有较强大的提示词理解和文字集成功能,在设计型应用中占据优势。但是设计风格更倾向于国外的风格,在国内可能有部分会水土不服。


Ideogram能在图像中生成清晰、可读的中英文文本(能做中文但质量差),英文比较精准,很多文章内容也可以cover。Magic Prompt 功能和 Reve 的 Enhance 一样好用,可以用于提高提示词创意质量。Canvas 有一些功能挺实用的,就是交互太难受了逻辑不清晰需要适应。


不足在与审美不够突出,艺术风格不够多元,也有风格迁移的类似功能,但是效果也不算很好。


往期相关:


3.4Whisk·创意探索工具

网址👉 https://labs.google/fx/zh/tools/whisk


Google Labs 的 Whisk ,可以通过上传图像作为提示(可以不用文本提示词)来快速生成和重混新图像,基于 Gemini 模型分析图像并使用 Imagen 4 生成输出。整体效果还不错,现在还能直接转视频就更有意思了。可以探索很多趣味玩法。


缺点是很不稳定,要登陆上这个网站是最大的挑战。风格控制还可以,混合图片效果不错,但一致性就一般。除了视频动效和不写提示也能跑的功能以外,其他功能现在ChatGPT 4o 和豆包也差不多可以替代了。


小结


我能共情每个产品一路走来所有人的付出和努力,不会因几个小问题就在文中全盘否定某个产品。我指出的产品不足都基于真实使用体验,希望这些问题能得到改善。


一次性写了10个我常用的 AI 图像生成工具以后,我比较常用和熟悉的 AI 图像生成与编辑工具已经写完了。不一定只能用一个工具,具体工作的时候,我们可以结合实际需求使用工具。比如我做AI短剧的素材,可以人物让 Midjourney 完成,三视图用 Kontext 输出,片头艺术字用即梦生成等等。


如果让我推荐3个必备AI图像生成工具,那么我推荐Midjourney、即梦/豆包(二选一)、星流。原因如下:


Midjourney:依然是目前审美最好的,不管什么 AI 工具,只要投产比能覆盖的时候优先体验最好的。


即梦/豆包:主要这俩一直在进步但是根源上又算同源的,让它俩占两个位置我过意不去,二选一又比较为难,所以放一起了,总之它们性价比都很高,下期讲视频还能讲即梦。


星流:星流单说生图方面也算是简化版的 Liblib 了,入门不难,本身图片美感也很不错,加上 Agent 加持,底层模型越强它越强,结合我的使用体验,我认为它会有光明的前途。我王多鱼投了!


写了关于星流的Agent功能的:


当然,其实还我印象中的还有很多,我之前也盘点过很多效果不错的生图工具,这里仅仅是提到我常用的,大家的习惯与喜好不同也实属正常。像堆友、智象、可图等的图片生成效果也在迭代中越来越惊艳,后来者像 Krea 1 等的图片模型也很有美感,目前各家在图像生成质量上已经非常接近,很难分出明显的高下了。


接下来的这个类目的发展重点可能会更多集中在落地应用上,我大胆推测可能更多的平台会结合自身优势,推出Agent 和类Agent 的工作台模式,但各平台也会探索符合自身特色的差异化路径。比如星流有星流设计Agent ,智象也有图片Agent ,豆包超能创意2.0的定位是生产力创意Agent ,还有美图的 RoboNeo 的定位是影像与设计Agent 等等。(Agent我会在之后单独写的!)


当然,无论形式如何变化,核心都会指向同一目标:简单、便捷、集成化地解决实际问题。


算起来,我今年2月份才开始写公众号文章,在这不到半年的时间里,各种AI工具层出不穷,刚吹完Gemini 2.0言出法随P图王中王,转眼Chat GPT4o出来把我脸都打肿的类似事件层出不穷,今天刚说这个好,明天就有更好的类似事件屡屡发生。


谢谢大家一直以来的包容。接下来也一起期待更多好产品和更多"打脸"哈哈哈。


后面我会再分享AI视频领域和AI效率工具领域我的一些心得体会。还得感谢一泽猛猛催更才有了这期。后续的坑也是挖好了,我会继续努力的!期待和大家共同进步!


文章来自公众号“阿真lrene”

AI中国

AI中国

7847 文章 1206736 浏览次数 950300 粉丝

评论 (0)

睡觉动画