标签: 打工人·进化岛

![](./09.assets/9d06e5044c32a79da4a4cc87173d661e.png)

你好，我是悦创。

前两讲中，我们已经学习了扩散模型的加噪去噪过程，了解了 UNet 模型用于预测噪声的算法原理。事实上，Stable Diffusion 模型在原始的 UNet 模型中加入了 Transformer 结构（至于怎么引入的，我们等下一讲学完 UNet 结构便会清楚），这么做可谓一举两得，因为 Transformer 结构不但能提升噪声去除效果，还是实现 prompt 控制图像内容的关键技术。

AI悦创原创2023/7/29...大约 3 分钟

08-巧用神经网络：如何用 UNet 预测噪声

![](./09.assets/9d06e5044c32a79da4a4cc87173d661e.png)

你好，我是悦创。

欢迎关注我公众号：AI悦创，有更多更好玩的等你发现！

AI悦创原创2023/7/29...大约 1 分钟

06-颠覆者扩散模型：直观去理解加噪与去噪

![](./08.assets/1300e54767ccb1888ea9647cc9ca10e1-0548670.png)

![](./08.assets/1300e54767ccb1888ea9647cc9ca10e1-20230728235735547.png)

你好，我是悦创。

上一讲我们结识了旧画师 GAN，提到了扩散模型在内容精致度、风格多样性和通用编辑等能力上弥补了 GAN 的不足之处。如果说 GAN 是旧画师，扩散模型无疑就是当下最受追捧的新画师。DALL-E 2、Imagen、Stable Diffusion 这些大名鼎鼎的模型，它们背后的魔术师都是扩散模型。

AI悦创原创2023/7/28...大约 13 分钟

05-旧画师 GAN：天生有缺陷还是学艺不精湛？

![](./07.assets/84dc017691cb7128f7fb48aa07f301a9.png)

![](./07.assets/84dc017691cb7128f7fb48aa07f301a9-0559390.png)

你好，我是悦创。

今天开始，我们正式进入 AI 绘画理论阶段的学习。我会带你理解图像生成模型背后的算法原理，掌握 AI 绘画主流算法方案背后通用的算法模块，并带你从零到一训练一个扩散模型。

基于扩散模型的 AI 绘画技术是我们这门课的主题，但其实在 22 年以前，GAN 才是业界公认的 AI 绘画技术首选。在老一辈的 AI 画图中，GAN（生成对抗网络）可以说是唯一的选择。相信你也在各种社交软件上见到过各种变小孩、变老、性别变换的视觉特效，这类效果通常就是靠 GAN 完成的。

AI悦创原创2023/7/26...大约 18 分钟

04-实战项目（一）：用 LoRA 制作一个你自己的漫画故事

![](./06.assets/a69e1b3b8fe2c89c5bc84aa0e8d7b70f.png)

![](./06.assets/a69e1b3b8fe2c89c5bc84aa0e8d7b70f-0559345.png)

你好，我是悦创。

前一讲我们学习了如何优化文生图、图生图过程中的关键参数，让 AI 模型更加听话。但是，如果我们想要进一步展现自己的创意和想象力，比如创作漫画时让 AI 帮我们生成特定风格和特定人物，又该怎么办呢？

为了解决这个问题，我们可以考虑在原有模型上引入 LoRA 技术。引入 LoRA（Low-Rank Adaptation），最初只是想把它当成微调大型语言模型的方法。然而，在 AI 绘画领域，它展现了独特的作用。通俗一点说，我们可以将 LoRA 比喻为一条在广袤大道上的小路，这两条路径都可以达到目的地，但所见的景色却完全不同。

AI悦创原创2023/7/24...大约 17 分钟

03-进阶应用：图生图技巧与创作社区初探

![](./05.assets/58ec92d62dd9ed24a2f6d6e6a6dfa55e.png)

![](./05.assets/58ec92d62dd9ed24a2f6d6e6a6dfa55e-0559305.png)

你好，我是悦创。

上一讲我们学习了很多文生图的 AI 绘画技巧。如果说文本生图是一种无中生有的绘画形式，那么图像生图无疑是锦上添花的绘画技巧。

今天这一讲，我会带你探索图生图的功能，了解图生图能力能够帮我们完成哪些任务，并通过控制重绘强度影响图生图的绘画效果。另外，我还会带你了解 Civitai 和 Hugging Face 这两个开源社区，用不同风格的模型帮我们进行 AI 绘画。学完这一讲，你就可以使用开源社区丰富的模型宝库，对自己手中的照片进行魔改了！