第8章 · Practice Projects

Embeddings 入門

Embeddings
→ で次のスライド · F でフルスクリーン · N で講師ノート · Esc で終了

重要キーワード

Embedding
埋め込み
テキストを高次元ベクトルに変換した表現
Voyage AI
ボヤージュAI
Anthropic 推奨の embedding 提供企業
Cosine Similarity
コサイン類似度
ベクトル間の角度で類似度を測る指標
Dimension
次元
ベクトルの長さ (例: 1024)

Embeddings

  • system / user / assistant の概念を最初に板書 (口頭) する。受講者にとって意外と分かりにくい所。
  • 同じ質問にペルソナを変えるデモはウケが良い。スライドで「禅僧」「大将」を出すと笑いが起きる。
  • system に置くべきもの (固定) と user に置くべきもの (可変) の切り分けは実装で重要。
  • 「医療相談を断るプロンプト」は安全性の現実的応用例として印象に残る。
Hands-on Exercise

演習: ローカル多言語 Embedding でクラスタリング

30 件の短文 (日本語/英語混在) を多言語 embedding でベクトル化し、KMeans で 3 クラスタに分けてください。

  • モデル: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
  • ライブラリ: sentence-transformers, scikit-learn
  • 出力: 各クラスタに含まれる文の一覧 (Markdown)
▶ Playground を開いて実行

理解度チェック

4 問のクイズで理解度を確認しましょう。

クイズを開く
🎉

まとめ

お疲れ様でした!