Stable Diffusion

Stable Diffusion（すてーぶるでぃふゅーじょん）とは、大量の画像データをもとにAIが学習したファイルをもとに、ユーザーが入力したテキスト（プロンプト）に沿って高品質な画像を自動生成する画像生成AIです。学習データを差し替えることで特定のキャラクターや作風に特化した画像生成も可能です。

概要

Stable Diffusionは2022年にStability AI社によって公開されたオープンソースの画像生成AIモデルであり、「潜在拡散モデル（Latent Diffusion Model）」という新しい技術を用いています。ノイズ画像から徐々にノイズを取り除いていくことで、リアルな画像を生成する仕組みになっています。このAIは、イラストや写真のようなリアルな画像、アニメ調のイラストなど多彩な表現が可能で、プロンプト（指示文）の内容に強く依存した多様な画像を短時間で生成できます。

主な特徴

ユーザーがテキストでイメージを指定するだけで画像を自動生成
オープンソースのため誰でも無料で使える
高いカスタマイズ性、独自の拡張や学習がしやすい
GPUメモリ消費が少なめで一般的なPCでも動作可能
クリエイティブ分野やデザイン、イラスト制作など幅広い分野で活用

他の画像生成AIとの違い

Stable Diffusionはオープンソースであること、高いカスタマイズ性、比較的軽量な動作が特徴であり、MidjourneyやDALL-Eなど商用系AIツールと比べて個人や開発者でも利用しやすい点が大きな差異です。

バージョンと進化

Stable Diffusionは登場以来バージョンアップを重ね、2024年以降はStable Diffusion 3.5など新バージョンが登場しており、生成画像の品質や表現力、カスタマイズ性が大幅に向上しています。

Stable Diffusion

目次

概要

主な特徴

他の画像生成AIとの違い

バージョンと進化

関連項目