AIモデル
AIモデルとは、コンピューターに大量のデータを読み込ませて学習させ、特定のパターンやルールを見つけ出させた「学習済みパラメータの集合」のことです。
人間の脳で例えると、勉強を重ねて身につけた「知識」や「判断基準」にあたります。
生成AI系モデル
- 大規模言語モデル:ChatGPTで一躍有名になったやつ。昨今のAIといえばこれ。
- 拡散モデル(Diffusion Models): ノイズから徐々に鮮明な画像を復元していく画像生成モデル。
- 敵対的生成ネットワーク(GAN): 偽物を作る「生成器」とそれを見破る「識別器」を競わせるモデル。
- 変分オートエンコーダー(VAE): データを一度圧縮し、そこから新しいデータを復元・生成するモデル。
- コード生成モデル: プログラミングコードの自動記述やバグ修正に特化したモデル。
画像認識系モデル
- ビジョン基盤モデル(CLIP, DINOv2, Segment Anythingなど):巨大な事前学習モデル。「ViTより凄え」と話題
- ビジョントランスフォーマー(ViT): Transformer構造を画像認識に応用し、高い精度を出すモデル。
- 畳み込みニューラルネットワーク(CNN): 画像の特徴を捉えるのが得意で、画像認識・分類の基本となるモデル。
- 物体検出モデル(YOLO, SSDなど): 画像内のどこに何があるかをリアルタイムで特定するモデル。
- セマンティックセグメンテーションモデル(U-Netなど): ピクセル単位で画像の領域を塗り分けるモデル。
音声系モデル
- 自動音声認識モデル(ASR / Whisperなど): 人間が話した声をテキストに書き起こすモデル。
- 音声合成モデル(TTS): テキストを自然なイントネーションで読み上げるモデル。
- 音響イベント検出モデル: 異音や特定の環境音を検知するモデル。
統計・予測・分類系モデル
- 回帰モデル: 過去のデータから将来の数値や確率を予測するモデル。
- 決定木・アンサンブル学習モデル(XGBoost, LightGBMなど): 表データの分析や予測に非常に強いモデル。
- サポートベクターマシン(SVM): データを境界線で分類するモデル。
- クラスタリングモデル(k-meansなど): データを傾向ごとに自動でグループ分けするモデル。
- 時系列予測モデル(ARIMA, Prophetなど): 時間経過とともに変化するデータの予測に特化したモデル。
その他の特殊なAIモデル
- レコメンダー(推薦システム): ユーザーの好みに合わせて商品やコンテンツをおすすめするモデル。
- 強化学習モデル: 試行錯誤を通じて最適な行動ルールを自ら学習するモデル。
- グラフニューラルネットワーク(GNN): SNSの人間関係や分子構造などのグラフ構造データを解析するモデル。