第9章 · Best Practices
Anthropic Workbench を使いこなす
Workbench
→ で次のスライド · F でフルスクリーン · N で講師ノート · Esc で終了
重要キーワード
Workbench
ワークベンチ
Anthropic Console 内のプロンプト編集・評価環境
Prompt Generator
プロンプト生成器
目的を入力すると初期プロンプト案を出してくれる機能
Test Case
テストケース
Eval に使う入力データ
Anthropic Workbench
Anthropic Console には Workbench という公式の プロンプト開発・評価環境 があります。 コードを書かずに、ブラウザでプロンプトを試行錯誤しながら作れます。
主な機能
- プロンプト編集: system / user / assistant を分けて編集
- モデル切替: Haiku / Sonnet / Opus をワンクリック比較
- パラメータ調整: temperature, max_tokens を直感的に
- Test Cases: 同じプロンプトを複数の入力で一括実行
- Prompt Generator: 目的入力 → プロンプト草案を Claude が作成
- Improver: 既存プロンプトを Claude が改善提案
- Code export: Python / TypeScript で同等のコードを生成
- Evaluate: 出力を採点して比較
Prompt Generator の使い方
- Console → Workbench → "Generate" タブ
- 「何をしたいか」を自然言語で記述
- Claude が system + user の雛形を生成
- テストケースを入れて反復改善
改善ループ
Prompt Generator で初版生成
↓
Test Cases で複数入力を試す
↓
Improver で改善案を取得
↓
A/B 比較で勝者を選ぶ
↓
Code export して本番に組み込む
Test Case パネル
- 入力を テーブルで管理
- Expected Output を入力すると合格判定
- 列を追加して 複数モデル並列実行 可能
Code Export
ワンクリックで Python / TypeScript / cURL のコードに変換:
# 自動生成例
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system="あなたは...",
messages=[{"role": "user", "content": "..."}]
)
Improver の例
既存のプロンプトに対して: - 曖昧な表現の指摘 - XML タグ化の提案 - Few-shot 例の追加 - 出力フォーマットの明示
Workbench vs プログラム実装
| Workbench | コード実装 | |
|---|---|---|
| プロンプト試行 | 高速 | 遅い (再起動必要) |
| バージョン管理 | 履歴あり | git |
| 統合 | 単発 | アプリ全体に組み込み |
| 自動化 | 手動 | Eval ツール経由で自動化 |
理想的な使い分けは: - 初期設計 → Workbench - 本番組み込み → コード + 自動 Eval
Console の他の機能
- Logs: API 呼び出し履歴
- Usage: 月間消費とモデル別ブレイクダウン
- API Keys: キー管理
- Settings: ワークスペース・チームメンバー
試す
実際に Workbench を開いてみる前に、まずローカルで設計練習。
▶ Workbench 模擬
私が「会議メモから ToDo を抽出する」プロンプトを Workbench で作るとします。最初の system プロンプト、Test Case 用の入力サンプル 3 件、期待出力 (JSON) を提案してください。Hands-on Exercise
演習: Workbench でプロンプトを作って Code Export
https://console.anthropic.com にログインし、Workbench で次のプロンプトを開発してください:
目的: ユーザーの自然言語スケジュール記述から ICS イベント情報 (start, end, title, attendees) を JSON で抽出。
手順: 1. Prompt Generator で初版生成 2. Test Cases に 5 件入力 (普通 3 件 + 境界 2 件) 3. Improver で改善 4. Sonnet と Haiku で比較 5. Python コードを Export Export したコードをローカルで実行して動作確認まで行いましょう。
🎉
まとめ
お疲れ様でした!