AIモデル

2026年6月15日 (月) 05:14時点におけるAdministrator (トーク | 投稿記録)による版 (ページの作成:「AIモデルとは、コンピューターに大量のデータを読み込ませて学習させ、特定のパターンやルールを見つけ出させた「学習済みパラメータの集合」のことです。人間の脳で例えると、勉強を重ねて身につけた「知識」や「判断基準」にあたります。 == 生成AI系モデル == * 大規模言語モデル：ChatGPTで一躍有名になったやつ。昨今のAIといえばこれ…」)

(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

AIモデルとは、コンピューターに大量のデータを読み込ませて学習させ、特定のパターンやルールを見つけ出させた「学習済みパラメータの集合」のことです。

人間の脳で例えると、勉強を重ねて身につけた「知識」や「判断基準」にあたります。

生成AI系モデル

大規模言語モデル：ChatGPTで一躍有名になったやつ。昨今のAIといえばこれ。
拡散モデル（Diffusion Models）: ノイズから徐々に鮮明な画像を復元していく画像生成モデル。
敵対的生成ネットワーク（GAN）: 偽物を作る「生成器」とそれを見破る「識別器」を競わせるモデル。
変分オートエンコーダー（VAE）: データを一度圧縮し、そこから新しいデータを復元・生成するモデル。
コード生成モデル: プログラミングコードの自動記述やバグ修正に特化したモデル。

画像認識系モデル

ビジョン基盤モデル（CLIP, DINOv2, Segment Anythingなど）：巨大な事前学習モデル。「ViTより凄え」と話題
ビジョントランスフォーマー（ViT）: Transformer構造を画像認識に応用し、高い精度を出すモデル。
畳み込みニューラルネットワーク（CNN）: 画像の特徴を捉えるのが得意で、画像認識・分類の基本となるモデル。
物体検出モデル（YOLO, SSDなど）: 画像内のどこに何があるかをリアルタイムで特定するモデル。
セマンティックセグメンテーションモデル（U-Netなど）: ピクセル単位で画像の領域を塗り分けるモデル。

音声系モデル

自動音声認識モデル（ASR / Whisperなど）: 人間が話した声をテキストに書き起こすモデル。
音声合成モデル（TTS）: テキストを自然なイントネーションで読み上げるモデル。
音響イベント検出モデル: 異音や特定の環境音を検知するモデル。

統計・予測・分類系モデル

回帰モデル: 過去のデータから将来の数値や確率を予測するモデル。
決定木・アンサンブル学習モデル（XGBoost, LightGBMなど）: 表データの分析や予測に非常に強いモデル。
サポートベクターマシン（SVM）: データを境界線で分類するモデル。
クラスタリングモデル（k-meansなど）: データを傾向ごとに自動でグループ分けするモデル。
時系列予測モデル（ARIMA, Prophetなど）: 時間経過とともに変化するデータの予測に特化したモデル。

その他の特殊なAIモデル

レコメンダー（推薦システム）: ユーザーの好みに合わせて商品やコンテンツをおすすめするモデル。
強化学習モデル: 試行錯誤を通じて最適な行動ルールを自ら学習するモデル。
グラフニューラルネットワーク（GNN）: SNSの人間関係や分子構造などのグラフ構造データを解析するモデル。

「https://monobook.org/w/index.php?title=AIモデル&oldid=32312」から取得