ベクトルストア構築 - AIエージェントの仕組み

この回のゴール

User: 明日のランチの予定を教えて
Claude: 明日は 12 時にアリスとイタリアンレストランです。

2026 年時点でよく使われるモデル:

モデル	提供	次元	用途
`paraphrase-multilingual-MiniLM-L12-v2`	HF	384	軽量・多言語
`text-embedding-3-small`	OpenAI	1536	バランス
`text-embedding-3-large`	OpenAI	3072	高精度
`voyage-3`	Voyage AI	1024	2024 年時点の最強クラス

注意: Claude API 自体は埋め込み専用 API を提供していません(2026 年現在)。RAG の検索部分は別途用意します。

{
  "type": "object",
  "properties": {
    "name": {"type": "string"},
    "age":  {"type": "integer"}
  },
  "required": ["name", "age"]
}

{"name": "Alice", "age": 30}    ✅
{"name": "Alice"}               ❌ age 欠けている
{"name": "Alice", "age": "三十"} ❌ age が文字列

ベクトル DB は通常「ベクトル → ID」しか返しません。メタデータ は別途管理:

wzxhzdk:3

wzxhzdk:4

正規化すれば、内積 = コサイン類似度 になります:

$$ \cos(\vec{a}, \vec{b}) = \frac{\vec{a} \cdot \vec{b}}{|\vec{a}| |\vec{b}|} \xrightarrow{\text{正規化後}} \vec{a} \cdot \vec{b} $$

だから FAISS の IndexFlatIP(内積)が cos 類似度検索になります。

実務の定番は k=3〜5 です。

長文を「1 つの文書」としてそのまま埋め込むと、意味が平均化されて検索ヒットしない。長文をどう区切る? 👉 次回「チャンク分割戦略」で、固定長・段落・再帰・セマンティックの 4 戦略を比較します。