画像生成 AI 入門:Python による拡散モデルの理論と実践#
リサーチサイエンティスト 北田 俊輔, Ph.D.
本レポジトリでは Coloso (コロソ) で開講されている "画像生成 AI 入門:Python による拡散モデルの理論と実践"
で扱う notebook を管理しています。各 notebook は Jupyter notebook としてまとめられており、Google Colab で実行されることを想定しています。
Coloso は 「業界トップクラスの専門家のノウハウをオンラインで学ぶ」 ことを目標に作られた VOD (ビデオ・オン・デマンド) 型オンライン教育サービスです。
🤗 講座の中心は "拡散モデル"#
現在注目されているテキストから画像を生成するモデルは、denoising diffusion probabilistic model (DDPM) [Ho+ NeruIPS'20] と呼ばれる、ノイズ除去拡散確率モデルを元にしています。
これまでとは異なる新たな生成モデルとしてより高精度な画像の生成が可能で従来の手法として主流であった Generative Adversarial Network (GAN) [Goodfellow+ NeurIPS'14] を超える性能を持っています。 複雑なデータ分布でも学習可能でその分布を解析的に評価することができます。
この講座は、画像生成 AI の主役となる拡散モデルの理解と実践を通し最新の画像生成技術について学びたい方におすすめです!
🎓 講座の内容#
講座の紹介: 画像生成に関する AI の基礎から、拡散モデルの理論、そして Python を使った実践的なアプローチまでをリサーチサイエンティストの北田俊輔が段階的にお教えします。
無制限視聴: 一回の購入で、リサーチサイエンティスト 北田俊輔が教える、拡散モデルの理論と実践を盛り込んだ講義動画 30 本を期間制限なしで受講することができます。
📄 実習資料#
Section |
Lecture |
Colab |
GitHub |
---|---|---|---|
1: Introduction to Diffusion Models and Stable Diffusion |
1: Welcome! |
||
2: Overview of the Course |
|||
3: Play with Stable Diffusion! |
|||
2: Basic Knowledge of Deep Learning |
4: About Deep Learning (1) |
||
5: About Deep Learning (2) |
|||
6: The Transformer Model |
|||
3: Basics of Diffusion Model |
7: Overview of Generative Model |
||
8: Score-based Generative Model |
|||
9: Denoising Diffusion Probabilistic Model (1) |
|||
10: Denoising Diffusion Probabilistic Model (2) |
|||
11: Beyond Conventional GANs |
|||
4: Key Researches Based on Non-Diffusion Models |
12: About CLIP |
||
13: Overview of Non-Diffusion Models (1) |
|||
14: Overview of Non-Diffusion Models (2) |
|||
5: Key Researches Based on Diffusion Models |
15: Overview of Diffusion Models (1) |
||
16. Overview of Diffusion Models (2) |
|||
6: Latent Diffusion and Stable Diffusion |
17: Overview of Latent Diffusion and Stable Diffusion |
||
18: Components of Stable Diffusion |
|||
7: Play with Diffusion Models |
19: Stable Diffusion |
||
20: Textual Inversion |
|||
21: DreamBooth |
|||
22: Attend-and-Excite |
|||
23: ControlNet |
|||
24: Prompt-to-Prompt |
|||
25: InstructPix2Pix |
|||
26: unCLIP |
|||
27: Paint-by-example |
|||
28: LoRA |
|||
29: Safe Latent Diffusion |
|||
8: Bonus Track |
30: Summary of the entire course and future prospects of image generation AI |
❓ 疑問点・修正点#
疑問点や修正点は本レポジトリの issue にて管理しています。不明点などがございましたら以下を確認し、解決方法が見つからない場合は新しく issue を作成してください。
🔗 関連リンク#
講座ページ | リサーチサイエンティスト 北田俊輔 | Coloso. | コロソ。https://coloso.jp/programming/researchscientist-kitada-jp
Colaboratory へようこそ - Colaboratory https://colab.research.google.com
Huggingface Diffusers https://huggingface.co/docs/diffusers/index
License#
MIT