第2章 · Prompt Engineering

Few-shot と Chain of Thought

Few-shot & Chain of Thought

→ で次のスライド · F でフルスクリーン · N で講師ノート · Esc で終了

重要キーワード

Few-shot

フューショット

数件の例を見せて挙動を誘導する手法

Chain of Thought (CoT)

連鎖思考

考えながら答えるよう促し、推論精度を上げる手法

Extended Thinking

拡張思考

Claude 内部で長い思考を行ってから回答するモード

ReAct

リアクト

Reasoning + Acting。推論と行動を交互に行うエージェントパターン

Few-shot Prompting

入力と理想の出力例をいくつか並べてから本番のタスクを与えると、フォーマット・スタイルの再現性が劇的に上がります。

入力: 「営業時間は 9-17 時です」
出力: {"open": "09:00", "close": "17:00"}

入力: 「土日休み、平日 10 時から 19 時」
出力: {"open": "10:00", "close": "19:00", "closed": ["sat", "sun"]}

入力: 「24 時間営業」
出力:

数件 (3〜5) で十分なことが多く、これを few-shot と呼びます。 1 件は one-shot, 例なしは zero-shot です。

Few-shot の落とし穴

例の偏り がそのまま出力の偏りになる (例が全部敬語 → 出力も全部敬語)。
例が長くなりすぎるとコストが膨れる。
境界ケース を含む例を選ぶと頑健になる。

Chain of Thought (CoT, 連鎖思考)

複雑な推論を要するタスクでは、Claude に 「考えながら答える」 よう促すと正答率が上がります。

wzxhzdk:1

Extended Thinking (拡張思考) との関係

Claude Opus 4.7 / Sonnet 4.6 などには Extended Thinking モードがあり、モデル内部で長い思考連鎖を行ってから回答します。プロンプトで明示的に CoT を書く代わりに、API パラメータで thinking を有効化できます。

wzxhzdk:2

CoT を書くべきとき / 書くべきでないとき

✅ 書くべき: - 数学・論理パズル - 多段の推論を要する分析 - バグ調査などの探索 - 複雑な分類タスク

❌ 書かなくていい: - 単純な分類・抽出 (むしろノイズになる) - レイテンシが厳しいリアルタイム応答 - 大量バッチ処理 (コスト爆増)

推論を見せる vs 見せない

ユーザーに CoT 部分を見せない 設計が一般的です。XML タグで分離してから抽出。

wzxhzdk:3

CoT を試す

実際に CoT 有無で答えが変わるか比べましょう。

▶ CoT 無し

りんごが 23 個あります。3 人で同じ数ずつ分け、余ったら花瓶に飾ります。一人いくつもらえますか?何個飾られますか?

▶ CoT 有り

りんごが 23 個あります。3 人で同じ数ずつ分け、余ったら花瓶に飾ります。

手順:
1. <thinking> で計算過程を段階的に書く
2. <answer> で最終回答だけを書く

Hands-on Exercise

演習: JSON 抽出を Few-shot で安定化

営業時間の自然言語記述から JSON を抽出するプロンプトを Few-shot で 書いてください。

入力例: 「平日 10 時から 19 時、日祝休み」

期待出力: 期待出力:

境界ケース (24 時間営業 / 中休みあり / 不明な記述) も含むテストを 3 件作って試してみましょう。

▶ Playground を開いて実行

Hands-on Exercise

演習: CoT で論理パズルを解かせる

次のパズルを CoT 無し と CoT 有り で解かせて、正答率を比較してみましょう。

A・B・C の 3 人がいる。A は嘘つき、B は正直者、C はランダムに答える。あなたは 3 人を区別できないが、Yes/No 質問を 1 回だけできる。どんな質問をすれば、正直者がどれかを必ず特定できるか?

(これは古典的な難問で、CoT 無しだとモデルがしばしば誤ります)

▶ Playground を開いて実行

理解度チェック

4 問のクイズで理解度を確認しましょう。

クイズを開く

🎉

まとめ

お疲れ様でした!