A
AIエージェントの仕組み
中級者向け — 仕組みから理解して Claude Code で実務に活かす
コース
💬 Q&A
📚 入門編 (claude-academy)
🐍 Pythonツール (ai-python-lab)
学習をはじめる
ホーム
/
第3章
/
Transformer の全体像
/
クイズ
Quiz · Transformer Architecture
Transformer の全体像 のクイズ
3 問。すべて選んだら採点ボタンを押してください。
Q1. Attention 単体に「位置エンコーディング」を加える理由は?
学習を高速化するため
Attention は内積で順序を見ないため、語順情報を明示的に注入する必要があるから
softmax のスケーリングのため
勾配消失を防ぐため
Q2. Transformer の総パラメータ数で最も大きな割合を占めるのは?
埋め込み層
Attention の W^Q, W^K, W^V
FFN (Feed-Forward Network)
出力 LM Head
Q3. Scaling Laws (Kaplan et al. 2020) が示したことは?
モデルサイズを増やすと損失が下がるが、その下がり方は予測可能なべき乗則に従う
モデルサイズと性能に関係はない
データ量だけが性能を決める
学習率を上げれば性能が上がる
採点する
サブステップへ戻る
スコア
0
/ 3