第9章 · Best Practices

Anthropic Workbench を使いこなす

Workbench
→ で次のスライド · F でフルスクリーン · N で講師ノート · Esc で終了

重要キーワード

Workbench
ワークベンチ
Anthropic Console 内のプロンプト編集・評価環境
Prompt Generator
プロンプト生成器
目的を入力すると初期プロンプト案を出してくれる機能
Test Case
テストケース
Eval に使う入力データ

Anthropic Workbench

Anthropic Console には Workbench という公式の プロンプト開発・評価環境 があります。 コードを書かずに、ブラウザでプロンプトを試行錯誤しながら作れます。

主な機能

  1. プロンプト編集: system / user / assistant を分けて編集
  2. モデル切替: Haiku / Sonnet / Opus をワンクリック比較
  3. パラメータ調整: temperature, max_tokens を直感的に
  4. Test Cases: 同じプロンプトを複数の入力で一括実行
  5. Prompt Generator: 目的入力 → プロンプト草案を Claude が作成
  6. Improver: 既存プロンプトを Claude が改善提案
  7. Code export: Python / TypeScript で同等のコードを生成
  8. Evaluate: 出力を採点して比較

Prompt Generator の使い方

  1. Console → Workbench → "Generate" タブ
  2. 「何をしたいか」を自然言語で記述
  3. Claude が system + user の雛形を生成
  4. テストケースを入れて反復改善

改善ループ

Prompt Generator で初版生成
    ↓
Test Cases で複数入力を試す
    ↓
Improver で改善案を取得
    ↓
A/B 比較で勝者を選ぶ
    ↓
Code export して本番に組み込む

Test Case パネル

  • 入力を テーブルで管理
  • Expected Output を入力すると合格判定
  • 列を追加して 複数モデル並列実行 可能

Code Export

ワンクリックで Python / TypeScript / cURL のコードに変換:

# 自動生成例
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system="あなたは...",
    messages=[{"role": "user", "content": "..."}]
)

Improver の例

既存のプロンプトに対して: - 曖昧な表現の指摘 - XML タグ化の提案 - Few-shot 例の追加 - 出力フォーマットの明示

Workbench vs プログラム実装

Workbench コード実装
プロンプト試行 高速 遅い (再起動必要)
バージョン管理 履歴あり git
統合 単発 アプリ全体に組み込み
自動化 手動 Eval ツール経由で自動化

理想的な使い分けは: - 初期設計 → Workbench - 本番組み込み → コード + 自動 Eval

Console の他の機能

  • Logs: API 呼び出し履歴
  • Usage: 月間消費とモデル別ブレイクダウン
  • API Keys: キー管理
  • Settings: ワークスペース・チームメンバー

試す

実際に Workbench を開いてみる前に、まずローカルで設計練習。

▶ Workbench 模擬
私が「会議メモから ToDo を抽出する」プロンプトを Workbench で作るとします。最初の system プロンプト、Test Case 用の入力サンプル 3 件、期待出力 (JSON) を提案してください。
Hands-on Exercise

演習: Workbench でプロンプトを作って Code Export

https://console.anthropic.com にログインし、Workbench で次のプロンプトを開発してください:

目的: ユーザーの自然言語スケジュール記述から ICS イベント情報 (start, end, title, attendees) を JSON で抽出。

手順: 1. Prompt Generator で初版生成 2. Test Cases に 5 件入力 (普通 3 件 + 境界 2 件) 3. Improver で改善 4. Sonnet と Haiku で比較 5. Python コードを Export Export したコードをローカルで実行して動作確認まで行いましょう。

▶ Playground を開いて実行

理解度チェック

3 問のクイズで理解度を確認しましょう。

クイズを開く
🎉

まとめ

お疲れ様でした!