Stable Diffusion
Stable Diffusion(すてーぶるでぃふゅーじょん)とは、大量の画像データをもとにAIが学習したファイルをもとに、ユーザーが入力したテキスト(プロンプト)に沿って高品質な画像を自動生成する画像生成AIです。学習データを差し替えることで特定のキャラクターや作風に特化した画像生成も可能です。
概要
Stable Diffusionは2022年にStability AI社によって公開されたオープンソースの画像生成AIモデルであり、「潜在拡散モデル(Latent Diffusion Model)」という新しい技術を用いています。ノイズ画像から徐々にノイズを取り除いていくことで、リアルな画像を生成する仕組みになっています。このAIは、イラストや写真のようなリアルな画像、アニメ調のイラストなど多彩な表現が可能で、プロンプト(指示文)の内容に強く依存した多様な画像を短時間で生成できます。
主な特徴
- ユーザーがテキストでイメージを指定するだけで画像を自動生成
- オープンソースのため誰でも無料で使える
- 高いカスタマイズ性、独自の拡張や学習がしやすい
- GPUメモリ消費が少なめで一般的なPCでも動作可能
- クリエイティブ分野やデザイン、イラスト制作など幅広い分野で活用
他の画像生成AIとの違い
Stable Diffusionはオープンソースであること、高いカスタマイズ性、比較的軽量な動作が特徴であり、MidjourneyやDALL-Eなど商用系AIツールと比べて個人や開発者でも利用しやすい点が大きな差異です。
バージョンと進化
Stable Diffusionは登場以来バージョンアップを重ね、2024年以降はStable Diffusion 3.5など新バージョンが登場しており、生成画像の品質や表現力、カスタマイズ性が大幅に向上しています。