第4章 · Advanced Claude API
Extended Thinking
Extended Thinking
→ で次のスライド · F でフルスクリーン · N で講師ノート · Esc で終了
重要キーワード
Extended Thinking
拡張思考
回答前に長い内部推論を行うモード
budget_tokens
思考予算
Extended Thinking 内部で使えるトークン上限
Reasoning Trace
推論トレース
内部思考の連鎖
Extended Thinking (拡張思考)
Claude Opus / Sonnet 4 系 には、回答前に長い思考連鎖を行う Extended Thinking モードがあります。 難問に対する正答率が向上しますが、トークンとレイテンシが増えます。
有効化
wzxhzdk:0
思考内容を読む
content に thinking ブロックが返ります。
wzxhzdk:1
いつ使うか
✅ 使うべき: - 数学・パズル・複雑な推論 - バグの根本原因分析 - マルチステップの計画立案 - 安全性の高い判断 (拒否すべきか吟味) - 多変数の最適化問題
❌ 使うべきでない: - 単純な Q&A や生成 - レイテンシが厳しい UI - 大量バッチで合計コストを抑えたいとき
通常 CoT との違い
| プロンプト CoT | Extended Thinking | |
|---|---|---|
| 制御 | プロンプトで指示 | API パラメータ |
| 出力に思考が混ざるか | 混ざる (タグで分離) | 別ブロックで自動分離 |
| 隠蔽 | 自分で除去 | 既定で隠蔽されている |
| 訓練 | 一般応答 | 思考専用に訓練済み |
注意
budget_tokensはmax_tokensの中でカウントされる ので、出力枠も別途必要。- 思考内容を そのままユーザーに見せるかは設計次第。生で見せると長すぎる/誤解を招くこともある。
- 安全性: 内部思考は最終回答ほど整っていないため、UI に出すなら注意書きを添える。
Tool Use と組み合わせる
Extended Thinking 中に ツールを呼ぶ計画 を立てさせることも可能です。 複雑なエージェントワークフローでは強力な組み合わせ。
試す
簡単な推論問題で見比べましょう。
▶ 難問を Opus で
ある工場で、3 つの機械 A・B・C が部品を作っています。A は 2 分に 1 個、B は 3 分に 1 個、C は 5 分に 1 個作ります。3 台同時に稼働して 60 分で何個できますか?ステップを示してから答えてください。Hands-on Exercise
演習: Extended Thinking 有無で正答率比較
次の 3 問について、thinking 無しと有り (budget_tokens=4000) で 5 回ずつ 実行し、正答率を比較してください。
- 「24 を 2 つ以上の素数の和で表す全パターンを列挙」
- 「100 から 1 までで、3 でも 5 でも割れる数の総和」
- 「2026 年 5 月 5 日は何曜日?ツェラーの公式で計算してください」
🎉
まとめ
お疲れ様でした!