跳至主要內容

01|AI 绘画的通用方法是什么?

AI悦创原创大约 15 分钟...约 4373 字

你好,我是悦创。

相信你已经在摩拳擦掌,希望赶快开始画画了。但是别着急,上手前,有三件事你得知道:

1)AI 到底适合画什么?它不是无所不能的。不先搞清楚这个问题,你会纳闷它为什么总画不到满意;

2)Midjourney 怎么调整初始设置,才能更好上手?

3)给AI下指令的核心方法是什么?别看大家天天说 AI 这厉害那厉害,可以识别自然语言等等,如果你想要画得好、画得快,下指令的方式就特别重要。

所以第一讲我们先不上手,先看看这几个问题的答案,为接下来的实操打一个基础。

1. AI 的能力边界

好,先说 AI 适合画什么,不适合画什么。

市面上有两种极端看法。有人说“ AI 现在什么都能画,已经是超级智能了”,还有人说“ AI 现在只能画小姐姐,一眼就能识破了”。

第二种说法很容易证伪。比如看这几张图。这都是我用 Midjourney v5 画的。

第一种说法需要展开说。AI 真的无所不能么?

所谓 AI 绘图,指的是以自然语言输入为主,描述一个画面,然后由 AI 输出图片的过程。它的底层逻辑主要是 GAN(生成对抗)算法,以及 diffusion(扩散)算法。当然,这些技术向的东西你完全不用了解。你只需要知道,因为它是这样的原理,所以不管你和它交流什么,AI 其实都不理解你,它只会笨拙地拿每个词语去检验图片数据库,看画出来的图,和你想要的相关性大不大

这就导致 AI 并不是无所不能,有这么几件事它干不了:

第一,AI 暂时不能画精确、有逻辑的图。因为刚才我们讲了,它的工作方式是靠大量数据去猜你满意的图画,而不是严丝合缝地去“绘制”。

比如说,AI 不能画准确的室内设计图、工业透视图,它只能画示意图;再比如说,AI 无法严谨地画出生物之间的尺寸关系。比如说远处有个长颈鹿,近处有个小蚂蚁,你想画出小蚂蚁比长颈鹿还大的效果,那 AI 没办法呈现严谨的透视关系,它只能画个大概。

第二,AI 暂时不能只依靠自然语言画出很有连贯性的图。换句话说,你用自然语言表述一个故事,每集的主人公可能都不一样。为什么呢?因为每次画图,它都得从头预测。即便输入相同的指令,每次出现的结果也不一样。除非我们用一些垫图的方法,这个在课程的后面讲漫画的时候也会讲到。

第三,AI 擅长综合表述,但暂时很难处理多个具体对象的互动。什么意思呢?比如说吧,你让它画个诺曼底登陆,它完成得非常出色。但你告诉他,画面里有两个士兵,一个个高,一个个矮,在共同操作一挺机关枪,它就犯愁了,不知道该怎么画。甚至如果画面里超过三个人,它处理完后,会多一个人、少一个人。

好,总结一下,AI 暂时不擅长画精确、有逻辑,或者很有连贯性,或者多个具体对象互动的图。当然,这只是目前的情况,如果它未来进化了,我随时做加餐告诉你。

那有人会问,它擅长什么呢?

首先,它特别擅长风格化创作,可以模仿世界上几乎所有存在,以及存在过的绘画风格。其次,AI 画得超级快。 从一个指令的输入到产出,短则半分钟,长则三四分钟,比大多数同品质的人工绘图,那效率不知道要高出多少倍。

AI 的第三个特长,是它可以通过融合过往的绘画风格,来帮你获得创意,这是最厉害的。比如你看,它可以让机甲出现在普通的中国城市:

也可以让米老鼠用匪帮的风格出现:

再比如,用现代波普艺术诠释古代山水画:

正是因为 AI 干活特别快,创意特别多,所以我觉得它是乙方的福音,比如搞游戏人物设计、道具设计的,或者搞建筑设计的,又或者搞海报设计、外包装设计等等。你可以迅速出很多小样给甲方选,而不用像以前那样,先猜甲方的需求,然后再反复用语言去确认需求。

2. 软件初始操作

好。了解了 AI 能画什么,不能画什么,接下来就是软件使用。下载与注册的方法,在课程详情页里给出了链接,我不多说了。这里我主要说几个初始操作。

首先,下载注册后,你肯定会看到这样的一个操作界面:

怎么画图呢?在对话框里输入:/imagine,这样对话框就变成了这样:

不管你画什么,默认每次生成的都是 4 个不同的图片,每张都不高清,用来让你判断有没有合适的。

不过在画之前,我推荐你选择合适的版本。这会让你事半功倍。

目前 Midjourney 有 5 个版本。简单比较,V5、V4 比较写实,V2、V3 比较抽象。我们输入同样的指令——一只猫,看看效果:cat --v 1

V1
这是 V1
这是 V1

可以看到前三个版本画出来的都比较抽象。我们看看 V4:

V4
V4

官方在今年 3 月中旬发布了 V5 版本,更擅长写实和细节的描绘,我们来看下:

V5
V5

如果你要画那种很写实的图,那么 V5、V4 比较适合你,如果你要画的本来就很抽象,比如未来会讲到的电影海报,那么调整版本到 V2、V3,可能会有奇效。

当然,如果你觉得每次输入很麻烦,可以就是在对话框里输入:/settings,这样就可以用按钮来选择默认的语句和版本了。

我们来看一个截屏:

1

开始的这些都是使用的模型,从 V1 到 V5,我们刚才提到了。后面还有两个 niji 模型,也就是画动漫的模型,在我们后面的课程里也会提到。再后面几个模型是不常用的,我们可以暂时先不管。再后面是图片像素质量的设定。「我们可以默认放在高质量。不过高质量消耗的额度是普通质量的两倍,如果你担心消耗额度太快,可以使用普通质量的模式。」这个部分使用:

https://docs.midjourney.com/docs/qualityopen in new window
https://docs.midjourney.com/docs/qualityopen in new window
Style
Style

接下来是几个 style 的选项,也就是风格化。风格化越高,指的是风格的变化越多。这里很难用一句两句讲清楚,我会在文稿里把官方的说明附上,你可以自行去查看。这里按照我的经验默认在 high 的位置就可以了。

https://docs.midjourney.com/docs/stylizeopen in new window
https://docs.midjourney.com/docs/stylizeopen in new window

公开模式
公开模式

接下来是公开模式,公开模式指的是别人会看到。这个只有最高级的会员才能换成隐私模式,所以我们默认都是公开模式就可以了。

fast
fast

最后是绘图模式,默认是在 fast,这是消耗额度的快速模式,速度很快,但我们每个月的额度有限。对于高档位的两个会员可以选择relax,这个是不消耗额度的,但是速度相对会慢一些。关于这个官方也有很详尽的说明,我们默认都可以在截图里选择的这些设置上就 OK 了。「我开的不是最高级的,所以没有 relax。」

我目前会员所设置的:

那如果我们把图画好了,该怎么输出高清大图呢?

你会看到每一个四连图下面都有 U1 到 U4,它们指代的就是刚才我们按顺序的这四张图,你点击 U1 到 U4,就会把高清大图输出了。那在 V4 的情况下输出高清大图是需要消耗额度的,在 V5 的情况下是不消耗额度的。查看目前的额度信息是在输入框里输入语句:/info

/info
/info

除了 U1 到 U4,下边还有 V1 到 V4。这个不是模型的版本了,它指的是 “Variation”,意思也是分别对这四张图进行重新绘制。比如,我们觉得第一张图还可以,想在第一张图基础上再迭代一下,调整一下,那就可以点击 V1 ,让 AI 重新参考这第一张图,按这张图的样式和风格,生成四张细节不太一样的四连图。

3. AI 绘画的核心方法

好,了解了 AI 的能力边界,搞定好了软件,接下来看怎么给 AI 下指令。

首先你要知道,AI 根本搞不懂你在说什么,它只是在靠标签搜索,所以不要和它说长句子,用词组、短语来交流,是最好的方式。你要尽可能让你使用的词语起到四两拨千斤的作用,圈定更准确的范围。

❌长句

✅词组、短语

比如说,怎么命令 AI 去打造一个匪帮小黄人?

这个时候你就要想了,什么关键词可能会有用。“tattoos” 也许会有用,也就是“纹身”,匪帮都有纹身。喜欢打游戏的朋友肯定知道,GTA这个关键词也可能有用,它是一款曾经风靡世界的游戏《侠盗猎车手》的缩写。好,我们试一试,输入:

Minions in GTAV style,tattoos,3D,c4d,clean background,realistic,cinematic,3.5mm,f2.1,fujifilm--v 4
命令生成

效果不错。

好。有人说,匪帮效果不明显。没问题,肯定可以调整,关键是怎么办?注意,不是告诉 AI “再来点”。还是我们刚才讲的,你要思考用什么词语能概括你想要的风格。比如说能不能用“现代战争”这个关键词?试一试,输入:

小黄人,士兵,现代战争,3D,c4d,干净背景,真实的,电影的,还有几个镜头语言。

Minions,soldier,modern wars,3D,c4d,clean background,realistic,cinematic,3.5mm,f2.1,fujifelm--v 4
命令生成

嗯,是不是也很有意思。所以说给 AI 下指令的关键,首先在于你能否选择准确的关键词。

我们把刚才匪帮小黄人的指令再次打在屏幕上:

  • Minions,soldier: “小黄人、士兵”是画面的主体;
  • modern wars,3D,c4d,clean background,realistic,cinematic,3.5mm,f2.1,fujifelm:“现代战争 ,3D,c4d,clean background,realistic,cinematic,3.5mm,f2.1,fujifelm”这些词,都是对画面风格的描述;
  • --v 4: 最后看“--v 4”,这是对画面属性的描述。

也就是说,给 AI 下指令,你要用一个“内容描述+风格描述+属性描述”的格式

  • 内容描述,就是主体,是骡子是马,是猴子是兔,穿什么衣服,在干什么;
  • 风格描述,包括艺术家、画笔风格等等;
  • 属性描述是最基本的图片属性,比如尺寸等。
  • 内容描述和风格描述都可以用“,”或者“+”隔开,而属性描述,要严格遵循:--【属性名】【空格】【属性值】的格式。

提示

这里我要提示一句,指令输入的顺序并不重要。因为 AI 识别指令时,给每个指令词的权重都是一样的,所以你在风格这块描述越多,图片就越风格化,主体部分描述越多,就更接近我们表达的内容。

那怎么确定这一串指令呢?不是去记忆什么指令库,而是不断尝试。给AI下指令的第三个要点,就是按照:

  • 确认任务
  • 确认主体
  • 确认风格
  • 润色和修正的顺序,依次去尝试不同的关键词。

我演示一下这个过程。

  1. 先确定任务,比如说,我要画一个酷酷的兔子,用来做我自己的播客头像。
  2. 再确定主体,比如说穿着帽衫的兔子:
a cute rabbit wearing a hoodie

看看效果:

命令生成
a cute rabbit wearing a hoodie

这个兔子虽然可爱,但太写实了。怎么办?第三步“确认风格”。

我们可以尝试皮克斯动画风格,像《玩具总动员》那样,也可以用迪士尼风格。另外,可以让兔子的眼睛再大一点。

好,试一下这个风格:

a cute rabbit is diving in ocean within diving suit,full body,big eyes,cinematic,realistic,pixar studio style --v 4

一只可爱的兔子穿着潜水服,全身,大眼睛,电影,逼真,皮克斯工作室风格——v4

命令操作
A cute rabbit is watching Mount Fuji,full body,wearing a dark red hoodie,real hair,big eyes,clean background,cinematic,realistic,Pixar studio style--v 4

一只可爱的兔子正在看富士山,全身上下,穿着深红色的卫衣,真头发,大眼睛,干净的背景,电影,现实,皮克斯工作室风格——v4

可以再是试一试:

命令
a cute rabbit is snowboarding down from snow,Fast speed,glasses,full body,wearing a dark red hoodie,big eyes,cinematic,realistic,pixar studio style --v 4

一只可爱的兔子正从雪地上滑下来,速度很快,戴着眼镜,全身上下,穿着深红色的连帽衫,大眼睛,电影般逼真,皮克斯工作室风格——v4

命令
a cute rabbit is diving in ocean within diving suit,full body,big eyes,cinematic,realistic,pixar studio style --v 4

一只可爱的兔子穿着潜水服在海洋中潜水,全身,大眼睛,电影般的,逼真的,皮克斯工作室风格——v4

你看,通过不断的尝试,在“确定风格”这一步,你就能基本上画出你想要的效果。

最后一步叫做“润色和修正”,就是对你已经画好的图,进行细节上的修改,比如你希望背景更加虚幻一些,可以调整光圈的数值。再比如之后的课程里我们会讲到垫图,就是你先喂给 AI 一张图,让它在这个基础上输出。说到垫图有一个重要的指令—— iw,指的是图片权重。它的数值是从0.5到2。数值越小代表参考原图越少,这个指令未来我们会反复讲到,这里你有个感性的认识就可以了。

好,到这里,第一讲的全部内容就讲完了。

从下一讲开始,我们就进入实操。我会把创作过程,用录屏的方式呈现给你,希望你能跟上我,一起尝试。好,来正式开启你的 AI 绘画之旅吧,我们先从头像开始。我是悦创,下一讲再见。

4. 划重点

1)想要更好地驾驭 AI,你得搞清楚三件事儿。第一,它能做什么不能做什么,第二,调整好软件的初始设置,尤其是版本设置,第三,用AI做图的通用方法;

2)AI 不擅长画精确、有逻辑,或者很有连贯性,或者多个具体对象互动的图,它擅长模仿别人的绘画风格,并且能够快速地融合过往风格,帮你获得创意;

3)AI 绘画的通用步骤,是“确认任务”、“确认主体”、“确认风格”、“润色和修正”。

欢迎关注我公众号:AI悦创,有更多更好玩的等你发现!

公众号:AI悦创【二维码】

AI悦创·编程一对一

AI悦创·推出辅导班啦,包括「Python 语言辅导班、C++ 辅导班、java 辅导班、算法/数据结构辅导班、少儿编程、pygame 游戏开发」,全部都是一对一教学:一对一辅导 + 一对一答疑 + 布置作业 + 项目实践等。当然,还有线下线上摄影课程、Photoshop、Premiere 一对一教学、QQ、微信在线,随时响应!微信:Jiabcdefh

C++ 信息奥赛题解,长期更新!长期招收一对一中小学信息奥赛集训,莆田、厦门地区有机会线下上门,其他地区线上。微信:Jiabcdefh

方法一:QQopen in new window

方法二:微信:Jiabcdefh

上次编辑于:
贡献者: AndersonHJB
你认为这篇文章怎么样?
  • 0
  • 0
  • 0
  • 0
  • 0
  • 0
评论
  • 按正序
  • 按倒序
  • 按热度