生成AIとは

学習目標: 生成AIの基本概念と識別モデルとの違いを理解する

生成モデル vs 識別モデル

識別モデル(Discriminative)

目的: データからクラスを予測

P(y|x) を学習 - 入力xが与えられたときのクラスyの確率


例:

  • 画像分類(猫か犬か)
  • スパム検出
  • 感情分析
生成モデル(Generative)

目的: データの分布を学習し、新しいデータを生成

P(x) または P(x|y) を学習 - データの生成確率


例:

  • 画像生成
  • テキスト生成
  • 音楽生成

主要な生成モデル

モデル 特徴 利点 欠点
VAE 確率的エンコーダ・デコーダ 潜在空間が滑らか、補間可能 出力がぼやけることがある
GAN 生成器と識別器の敵対的学習 シャープな画像を生成 学習が不安定、モード崩壊
拡散モデル ノイズの段階的除去 高品質、多様性が高い 生成が遅い
自己回帰モデル 逐次的に生成 柔軟、確率計算が容易 生成が遅い

生成AIの歴史

2013 - VAE

Kingma & Welling による変分オートエンコーダの提案

2014 - GAN

Ian Goodfellow による敵対的生成ネットワークの発明

2020 - 拡散モデル

DDPMにより拡散モデルが注目を集める

2022- - 大規模生成AI

DALL-E 2, Stable Diffusion, Midjourney, Sora など

理解度チェック

Q. 生成モデルの主な目的は何ですか?