01｜AI 绘画的通用方法是什么？

AI悦创原创大约 15 分钟...约 4373 字

你好，我是悦创。

相信你已经在摩拳擦掌，希望赶快开始画画了。但是别着急，上手前，有三件事你得知道：

1）AI 到底适合画什么？它不是无所不能的。不先搞清楚这个问题，你会纳闷它为什么总画不到满意；

2）Midjourney 怎么调整初始设置，才能更好上手？

3）给AI下指令的核心方法是什么？别看大家天天说 AI 这厉害那厉害，可以识别自然语言等等，如果你想要画得好、画得快，下指令的方式就特别重要。

所以第一讲我们先不上手，先看看这几个问题的答案，为接下来的实操打一个基础。

1. AI 的能力边界

好，先说 AI 适合画什么，不适合画什么。

市面上有两种极端看法。有人说“ AI 现在什么都能画，已经是超级智能了”，还有人说“ AI 现在只能画小姐姐，一眼就能识破了”。

第二种说法很容易证伪。比如看这几张图。这都是我用 Midjourney v5 画的。

第一种说法需要展开说。AI 真的无所不能么？

所谓 AI 绘图，指的是以自然语言输入为主，描述一个画面，然后由 AI 输出图片的过程。它的底层逻辑主要是 GAN（生成对抗）算法，以及 diffusion（扩散）算法。当然，这些技术向的东西你完全不用了解。你只需要知道，因为它是这样的原理，所以不管你和它交流什么，AI 其实都不理解你，它只会笨拙地拿每个词语去检验图片数据库，看画出来的图，和你想要的相关性大不大。

这就导致 AI 并不是无所不能，有这么几件事它干不了：

第一，AI 暂时不能画精确、有逻辑的图。因为刚才我们讲了，它的工作方式是靠大量数据去猜你满意的图画，而不是严丝合缝地去“绘制”。

比如说，AI 不能画准确的室内设计图、工业透视图，它只能画示意图；再比如说，AI 无法严谨地画出生物之间的尺寸关系。比如说远处有个长颈鹿，近处有个小蚂蚁，你想画出小蚂蚁比长颈鹿还大的效果，那 AI 没办法呈现严谨的透视关系，它只能画个大概。

第二，AI 暂时不能只依靠自然语言画出很有连贯性的图。换句话说，你用自然语言表述一个故事，每集的主人公可能都不一样。为什么呢？因为每次画图，它都得从头预测。即便输入相同的指令，每次出现的结果也不一样。除非我们用一些垫图的方法，这个在课程的后面讲漫画的时候也会讲到。

第三，AI 擅长综合表述，但暂时很难处理多个具体对象的互动。什么意思呢？比如说吧，你让它画个诺曼底登陆，它完成得非常出色。但你告诉他，画面里有两个士兵，一个个高，一个个矮，在共同操作一挺机关枪，它就犯愁了，不知道该怎么画。甚至如果画面里超过三个人，它处理完后，会多一个人、少一个人。

好，总结一下，AI 暂时不擅长画精确、有逻辑，或者很有连贯性，或者多个具体对象互动的图。当然，这只是目前的情况，如果它未来进化了，我随时做加餐告诉你。

那有人会问，它擅长什么呢？

首先，它特别擅长风格化创作，可以模仿世界上几乎所有存在，以及存在过的绘画风格。其次，AI 画得超级快。 从一个指令的输入到产出，短则半分钟，长则三四分钟，比大多数同品质的人工绘图，那效率不知道要高出多少倍。

AI 的第三个特长，是它可以通过融合过往的绘画风格，来帮你获得创意，这是最厉害的。比如你看，它可以让机甲出现在普通的中国城市：

也可以让米老鼠用匪帮的风格出现：

再比如，用现代波普艺术诠释古代山水画：

正是因为 AI 干活特别快，创意特别多，所以我觉得它是乙方的福音，比如搞游戏人物设计、道具设计的，或者搞建筑设计的，又或者搞海报设计、外包装设计等等。你可以迅速出很多小样给甲方选，而不用像以前那样，先猜甲方的需求，然后再反复用语言去确认需求。

2. 软件初始操作

好。了解了 AI 能画什么，不能画什么，接下来就是软件使用。下载与注册的方法，在课程详情页里给出了链接，我不多说了。这里我主要说几个初始操作。

首先，下载注册后，你肯定会看到这样的一个操作界面：

怎么画图呢？在对话框里输入：/imagine，这样对话框就变成了这样：

不管你画什么，默认每次生成的都是 4 个不同的图片，每张都不高清，用来让你判断有没有合适的。

不过在画之前，我推荐你选择合适的版本。这会让你事半功倍。

目前 Midjourney 有 5 个版本。简单比较，V5、V4 比较写实，V2、V3 比较抽象。我们输入同样的指令——一只猫，看看效果：cat --v 1

可以看到前三个版本画出来的都比较抽象。我们看看 V4:

官方在今年 3 月中旬发布了 V5 版本，更擅长写实和细节的描绘，我们来看下：

如果你要画那种很写实的图，那么 V5、V4 比较适合你，如果你要画的本来就很抽象，比如未来会讲到的电影海报，那么调整版本到 V2、V3，可能会有奇效。

当然，如果你觉得每次输入很麻烦，可以就是在对话框里输入：/settings，这样就可以用按钮来选择默认的语句和版本了。

我们来看一个截屏：

多个模型

Niji

开始的这些都是使用的模型，从 V1 到 V5，我们刚才提到了。后面还有两个 niji 模型，也就是画动漫的模型，在我们后面的课程里也会提到。再后面几个模型是不常用的，我们可以暂时先不管。再后面是图片像素质量的设定。「我们可以默认放在高质量。不过高质量消耗的额度是普通质量的两倍，如果你担心消耗额度太快，可以使用普通质量的模式。」这个部分使用：

https://docs.midjourney.com/docs/quality

接下来是几个 style 的选项，也就是风格化。风格化越高，指的是风格的变化越多。这里很难用一句两句讲清楚，我会在文稿里把官方的说明附上，你可以自行去查看。这里按照我的经验默认在 high 的位置就可以了。

https://docs.midjourney.com/docs/stylize

接下来是公开模式，公开模式指的是别人会看到。这个只有最高级的会员才能换成隐私模式，所以我们默认都是公开模式就可以了。

最后是绘图模式，默认是在 fast，这是消耗额度的快速模式，速度很快，但我们每个月的额度有限。对于高档位的两个会员可以选择relax，这个是不消耗额度的，但是速度相对会慢一些。关于这个官方也有很详尽的说明，我们默认都可以在截图里选择的这些设置上就 OK 了。「我开的不是最高级的，所以没有 relax。」

我目前会员所设置的：

那如果我们把图画好了，该怎么输出高清大图呢？

你会看到每一个四连图下面都有 U1 到 U4，它们指代的就是刚才我们按顺序的这四张图，你点击 U1 到 U4，就会把高清大图输出了。那在 V4 的情况下输出高清大图是需要消耗额度的，在 V5 的情况下是不消耗额度的。查看目前的额度信息是在输入框里输入语句：/info。

除了 U1 到 U4，下边还有 V1 到 V4。这个不是模型的版本了，它指的是 “Variation”，意思也是分别对这四张图进行重新绘制。比如，我们觉得第一张图还可以，想在第一张图基础上再迭代一下，调整一下，那就可以点击 V1 ，让 AI 重新参考这第一张图，按这张图的样式和风格，生成四张细节不太一样的四连图。

3. AI 绘画的核心方法

好，了解了 AI 的能力边界，搞定好了软件，接下来看怎么给 AI 下指令。

首先你要知道，AI 根本搞不懂你在说什么，它只是在靠标签搜索，所以不要和它说长句子，用词组、短语来交流，是最好的方式。你要尽可能让你使用的词语起到四两拨千斤的作用，圈定更准确的范围。

❌长句

✅词组、短语

比如说，怎么命令 AI 去打造一个匪帮小黄人？

这个时候你就要想了，什么关键词可能会有用。“tattoos” 也许会有用，也就是“纹身”，匪帮都有纹身。喜欢打游戏的朋友肯定知道，GTA这个关键词也可能有用，它是一款曾经风靡世界的游戏《侠盗猎车手》的缩写。好，我们试一试，输入：

Minions in GTAV style,tattoos,3D,c4d,clean background,realistic,cinematic,3.5mm,f2.1,fujifilm--v 4

命令生成

Other

效果不错。

好。有人说，匪帮效果不明显。没问题，肯定可以调整，关键是怎么办？注意，不是告诉 AI “再来点”。还是我们刚才讲的，你要思考用什么词语能概括你想要的风格。比如说能不能用“现代战争”这个关键词？试一试，输入：

小黄人，士兵，现代战争，3D，c4d，干净背景，真实的，电影的，还有几个镜头语言。

Minions,soldier,modern wars,3D,c4d,clean background,realistic,cinematic,3.5mm,f2.1,fujifelm--v 4

命令生成

Other

Test

嗯，是不是也很有意思。所以说给 AI 下指令的关键，首先在于你能否选择准确的关键词。

我们把刚才匪帮小黄人的指令再次打在屏幕上：

Minions,soldier: “小黄人、士兵”是画面的主体；
modern wars，3D，c4d，clean background，realistic，cinematic，3.5mm，f2.1，fujifelm:“现代战争，3D，c4d，clean background，realistic，cinematic，3.5mm，f2.1，fujifelm”这些词，都是对画面风格的描述；
--v 4: 最后看“--v 4”，这是对画面属性的描述。

也就是说，给 AI 下指令，你要用一个“内容描述+风格描述+属性描述”的格式。

内容描述，就是主体，是骡子是马，是猴子是兔，穿什么衣服，在干什么；
风格描述，包括艺术家、画笔风格等等；
属性描述是最基本的图片属性，比如尺寸等。
内容描述和风格描述都可以用“,”或者“+”隔开，而属性描述，要严格遵循：--【属性名】【空格】【属性值】的格式。

提示

这里我要提示一句，指令输入的顺序并不重要。因为 AI 识别指令时，给每个指令词的权重都是一样的，所以你在风格这块描述越多，图片就越风格化，主体部分描述越多，就更接近我们表达的内容。

那怎么确定这一串指令呢？不是去记忆什么指令库，而是不断尝试。给AI下指令的第三个要点，就是按照:

确认任务
确认主体
确认风格
润色和修正的顺序，依次去尝试不同的关键词。

我演示一下这个过程。

先确定任务，比如说，我要画一个酷酷的兔子，用来做我自己的播客头像。
再确定主体，比如说穿着帽衫的兔子：

a cute rabbit wearing a hoodie

看看效果：

命令生成

a cute rabbit wearing a hoodie

Other

这个兔子虽然可爱，但太写实了。怎么办？第三步“确认风格”。

我们可以尝试皮克斯动画风格，像《玩具总动员》那样，也可以用迪士尼风格。另外，可以让兔子的眼睛再大一点。

好，试一下这个风格：

a cute rabbit is diving in ocean within diving suit,full body,big eyes,cinematic,realistic,pixar studio style --v 4

一只可爱的兔子穿着潜水服，全身，大眼睛，电影，逼真，皮克斯工作室风格——v4

命令操作

A cute rabbit is watching Mount Fuji,full body,wearing a dark red hoodie,real hair,big eyes,clean background,cinematic,realistic,Pixar studio style--v 4

一只可爱的兔子正在看富士山，全身上下，穿着深红色的卫衣，真头发，大眼睛，干净的背景，电影，现实，皮克斯工作室风格——v4

可以再是试一试：

命令

a cute rabbit is snowboarding down from snow,Fast speed,glasses,full body,wearing a dark red hoodie,big eyes,cinematic,realistic,pixar studio style --v 4

一只可爱的兔子正从雪地上滑下来，速度很快，戴着眼镜，全身上下，穿着深红色的连帽衫，大眼睛，电影般逼真，皮克斯工作室风格——v4

Other

命令

a cute rabbit is diving in ocean within diving suit,full body,big eyes,cinematic,realistic,pixar studio style --v 4

一只可爱的兔子穿着潜水服在海洋中潜水，全身，大眼睛，电影般的，逼真的，皮克斯工作室风格——v4

Other

你看，通过不断的尝试，在“确定风格”这一步，你就能基本上画出你想要的效果。

最后一步叫做“润色和修正”，就是对你已经画好的图，进行细节上的修改，比如你希望背景更加虚幻一些，可以调整光圈的数值。再比如之后的课程里我们会讲到垫图，就是你先喂给 AI 一张图，让它在这个基础上输出。说到垫图有一个重要的指令—— iw，指的是图片权重。它的数值是从0.5到2。数值越小代表参考原图越少，这个指令未来我们会反复讲到，这里你有个感性的认识就可以了。

好，到这里，第一讲的全部内容就讲完了。

从下一讲开始，我们就进入实操。我会把创作过程，用录屏的方式呈现给你，希望你能跟上我，一起尝试。好，来正式开启你的 AI 绘画之旅吧，我们先从头像开始。我是悦创，下一讲再见。

4. 划重点

1）想要更好地驾驭 AI，你得搞清楚三件事儿。第一，它能做什么不能做什么，第二，调整好软件的初始设置，尤其是版本设置，第三，用AI做图的通用方法；

2）AI 不擅长画精确、有逻辑，或者很有连贯性，或者多个具体对象互动的图，它擅长模仿别人的绘画风格，并且能够快速地融合过往风格，帮你获得创意；

3）AI 绘画的通用步骤，是“确认任务”、“确认主体”、“确认风格”、“润色和修正”。

欢迎关注我公众号：AI悦创，有更多更好玩的等你发现！

公众号：AI悦创【二维码】

AI悦创·编程一对一

AI悦创·推出辅导班啦，包括「Python 语言辅导班、C++ 辅导班、java 辅导班、算法/数据结构辅导班、少儿编程、pygame 游戏开发」，全部都是一对一教学：一对一辅导 + 一对一答疑 + 布置作业 + 项目实践等。当然，还有线下线上摄影课程、Photoshop、Premiere 一对一教学、QQ、微信在线，随时响应！微信：Jiabcdefh

C++ 信息奥赛题解，长期更新！长期招收一对一中小学信息奥赛集训，莆田、厦门地区有机会线下上门，其他地区线上。微信：Jiabcdefh

方法一：QQ

方法二：微信：Jiabcdefh