第8章 · Practice Projects
Embeddings 入門
Embeddings
→ で次のスライド · F でフルスクリーン · N で講師ノート · Esc で終了
重要キーワード
Embedding
埋め込み
テキストを高次元ベクトルに変換した表現
Voyage AI
ボヤージュAI
Anthropic 推奨の embedding 提供企業
Cosine Similarity
コサイン類似度
ベクトル間の角度で類似度を測る指標
Dimension
次元
ベクトルの長さ (例: 1024)
Embeddings
- system / user / assistant の概念を最初に板書 (口頭) する。受講者にとって意外と分かりにくい所。
- 同じ質問にペルソナを変えるデモはウケが良い。スライドで「禅僧」「大将」を出すと笑いが起きる。
- system に置くべきもの (固定) と user に置くべきもの (可変) の切り分けは実装で重要。
- 「医療相談を断るプロンプト」は安全性の現実的応用例として印象に残る。
Hands-on Exercise
演習: ローカル多言語 Embedding でクラスタリング
30 件の短文 (日本語/英語混在) を多言語 embedding でベクトル化し、KMeans で 3 クラスタに分けてください。
- モデル:
sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 - ライブラリ:
sentence-transformers,scikit-learn - 出力: 各クラスタに含まれる文の一覧 (Markdown)
🎉
まとめ
お疲れ様でした!