跳至主要內容
07-AIGC 的核心魔法:搞懂 Transformer

![](./09.assets/9d06e5044c32a79da4a4cc87173d661e.png)

你好,我是悦创。

前两讲中,我们已经学习了扩散模型的加噪去噪过程,了解了 UNet 模型用于预测噪声的算法原理。事实上,Stable Diffusion 模型在原始的 UNet 模型中加入了 Transformer 结构(至于怎么引入的,我们等下一讲学完 UNet 结构便会清楚),这么做可谓一举两得,因为 Transformer 结构不但能提升噪声去除效果,还是实现 prompt 控制图像内容的关键技术。


AI悦创原创...大约 3 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
08-巧用神经网络:如何用 UNet 预测噪声

![](./09.assets/9d06e5044c32a79da4a4cc87173d661e.png)

你好,我是悦创。

前两讲中,我们已经学习了扩散模型的加噪去噪过程,了解了 UNet 模型用于预测噪声的算法原理。事实上,Stable Diffusion 模型在原始的 UNet 模型中加入了 Transformer 结构(至于怎么引入的,我们等下一讲学完 UNet 结构便会清楚),这么做可谓一举两得,因为 Transformer 结构不但能提升噪声去除效果,还是实现 prompt 控制图像内容的关键技术。

欢迎关注我公众号:AI悦创,有更多更好玩的等你发现!


AI悦创原创...大约 1 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
06-颠覆者扩散模型:直观去理解加噪与去噪

![](./08.assets/1300e54767ccb1888ea9647cc9ca10e1-0548670.png)

![](./08.assets/1300e54767ccb1888ea9647cc9ca10e1-20230728235735547.png)

你好,我是悦创。

上一讲我们结识了旧画师 GAN,提到了扩散模型在内容精致度、风格多样性和通用编辑等能力上弥补了 GAN 的不足之处。如果说 GAN 是旧画师,扩散模型无疑就是当下最受追捧的新画师。DALL-E 2、Imagen、Stable Diffusion 这些大名鼎鼎的模型,它们背后的魔术师都是扩散模型。


AI悦创原创...大约 13 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
05-旧画师 GAN:天生有缺陷还是学艺不精湛?

![](./07.assets/84dc017691cb7128f7fb48aa07f301a9.png)

![](./07.assets/84dc017691cb7128f7fb48aa07f301a9-0559390.png)

你好,我是悦创。

今天开始,我们正式进入 AI 绘画理论阶段的学习。我会带你理解图像生成模型背后的算法原理,掌握 AI 绘画主流算法方案背后通用的算法模块,并带你从零到一训练一个扩散模型。

基于扩散模型的 AI 绘画技术是我们这门课的主题,但其实在 22 年以前,GAN 才是业界公认的 AI 绘画技术首选。在老一辈的 AI 画图中,GAN(生成对抗网络)可以说是唯一的选择。相信你也在各种社交软件上见到过各种变小孩、变老、性别变换的视觉特效,这类效果通常就是靠 GAN 完成的。


AI悦创原创...大约 18 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
04-实战项目(一):用 LoRA 制作一个你自己的漫画故事

![](./06.assets/a69e1b3b8fe2c89c5bc84aa0e8d7b70f.png)

![](./06.assets/a69e1b3b8fe2c89c5bc84aa0e8d7b70f-0559345.png)

你好,我是悦创。

前一讲我们学习了如何优化文生图、图生图过程中的关键参数,让 AI 模型更加听话。但是,如果我们想要进一步展现自己的创意和想象力,比如创作漫画时让 AI 帮我们生成特定风格和特定人物,又该怎么办呢?

为了解决这个问题,我们可以考虑在原有模型上引入 LoRA 技术。引入 LoRA(Low-Rank Adaptation),最初只是想把它当成微调大型语言模型的方法。然而,在 AI 绘画领域,它展现了独特的作用。通俗一点说,我们可以将 LoRA 比喻为一条在广袤大道上的小路,这两条路径都可以达到目的地,但所见的景色却完全不同。


AI悦创原创...大约 17 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
03-进阶应用:图生图技巧与创作社区初探

![](./05.assets/58ec92d62dd9ed24a2f6d6e6a6dfa55e.png)

![](./05.assets/58ec92d62dd9ed24a2f6d6e6a6dfa55e-0559305.png)

你好,我是悦创。

上一讲我们学习了很多文生图的 AI 绘画技巧。如果说文本生图是一种无中生有的绘画形式,那么图像生图无疑是锦上添花的绘画技巧。

今天这一讲,我会带你探索图生图的功能,了解图生图能力能够帮我们完成哪些任务,并通过控制重绘强度影响图生图的绘画效果。另外,我还会带你了解 Civitai 和 Hugging Face 这两个开源社区,用不同风格的模型帮我们进行 AI 绘画。学完这一讲,你就可以使用开源社区丰富的模型宝库,对自己手中的照片进行魔改了!


AI悦创原创...大约 16 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
02-Prompt 使用技巧:如何更精准地控制绘画风格和内容?

![](./04.assets/a7e643b0cf3daef266ba0f56260a2525.png)

![](./04.assets/a7e643b0cf3daef266ba0f56260a2525-0559247.png)

你好,我是悦创。

之前我们解锁了 Web UI 的七大特色功能,如果拿烹饪来做比喻,前一讲的内容大概只是把菜做熟的程度,还无法产出“色香味”俱全的图像作品。实际应用的时候,你很可能遇到后面这些困扰。

  • 图生图如何优化,如何生成具有特定特征或内容的图像?
  • 输入了提示词,但 AI 模型不太“听话”,要怎么做参数调优?
  • 怎样生成多样风格的图像作品?

AI悦创原创...大约 12 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
01-WebUI:免费AI绘画工具箱的 N 大绘图功能

![](./03.assets/28a2eccf0019ab76bcb0f02592fa7509.png)

![](./03.assets/28a2eccf0019ab76bcb0f02592fa7509-0559222.png)

你好,我是悦创。

欢迎和我一起探索 AI 绘画的魅力。热身篇这一章相当于整个学习过程里的“新手村”,我会带你一起熟悉各种各样免费开源的 AI 绘画工具和模型,帮助你全面掌握 AI 绘画的无限潜能。

今天是课程的第一讲,我们先从 Stable Diffusion 和 WebUI 说起。学完今天的内容,你不但能够知道 Stable Diffusion 的来龙去脉,还能解锁 WebUI 里的特色功能,来实现各种富有想象力的视觉创意。


AI悦创原创...大约 18 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
先导篇|先睹为快,AI 绘画作品集

![](./02.assets/c1cea4c799c73fa7163792d3a90c4275.jpg)

![](./02.assets/c1cea4c799c73fa7163792d3a90c4275-0559191.jpg)

你好,我是悦创。

在过去的一年,AI 绘画的各种惊艳能力和效果,铺天盖地向我们涌来。无论是 LensaAI 的创意头像生成,或者是 Midjourney 足以以假乱真的 AI 绘画效果,再或者是 Adobe Firefly 变魔术般的 AI 修图能力,都让我们叹为观止。


AI悦创原创...大约 11 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛
开篇词|AI 技术爆发,如何实现绘画模型自由?

![](./01.assets/fa355671d303b108c9de618ef7f9ba6f.jpg)

![](./01.assets/fa355671d303b108c9de618ef7f9ba6f-0559166.jpg)

你好,我是悦创。

非常欢迎你加入我的课程,与我一起探索 AI 绘画技术背后的奥秘。

先做个自我介绍,作为一名计算私教的从业者,我的学员、朋友也不乏是计算机视觉从业者,他们一直活跃在 AI 绘画技术领域。这么多年的工作里,他们在图像风格化、图像生成、数字人等技术方向积累了丰富经验。其中一个朋友目前在一家头部互联网公司工作,正带领他的团队全力推动多模态大模型领域的能力建设。


AI悦创原创...大约 9 分钟ChatGPTChatGPTStableDiffusion打工人·进化岛ChatGPTChatGPTStableDiffusion打工人·进化岛