商品名	価格	検索結果	理由
赤いワンピース	¥12,800	ヒット	完全一致
クリムゾンドレス	¥15,600	ヒットしない	「赤い」が含まれない
真紅のワンピース	¥18,900	ヒットしない	「赤い」が含まれない
ルビーレッドワンピース	¥22,400	ヒットしない	「赤い」が含まれない
ワインレッドドレス	¥16,800	ヒットしない	「ワンピース」が含まれない

商品名	価格	説明文	検索結果	スコア
赤いワンピース	¥12,800	鮮やかな赤色のエレガントなワンピース	ヒット	2.1
真紅のワンピース	¥18,900	美しい真紅色のフォーマルワンピース	「ワンピース」のみヒット	0.8
クリムゾンドレス	¥15,600	深紅色の上品なパーティードレス	ヒットしない	0.0
ネイビードレス	¥14,200	紺色のドレス、赤いベルト付き	「赤い」で誤ヒット	0.5
ルビーレッドワンピース	¥22,400	宝石のような赤色のワンピース	「ワンピース」のみヒット	0.8

商品名	価格	類似度スコア	検索結果	理由
赤いワンピース	¥12,800	0.98	ヒット	完全一致
真紅のワンピース	¥18,900	0.92	ヒット	「真紅」=「赤い」を理解
クリムゾンドレス	¥15,600	0.89	ヒット	「クリムゾン」=「赤い」を理解
ルビーレッドワンピース	¥22,400	0.85	ヒット	「ルビーレッド」=「赤い」を理解
ワインレッドドレス	¥16,800	0.78	ヒット	「ワインレッド」=「赤い」を理解
スカーレットワンピース	¥9,800	0.82	ヒット	「スカーレット」=「赤い」を理解

機能	PostgreSQL + pgvector	MySQL 9 標準サーバー
距離計算	完全サポート	HeatWave専用
インデックス	HNSW/IVFFlat	作成不可
最大次元数	16,000	16,383
類似度検索	高速	アプリ層で実装必要

機能	PostgreSQL + pgvector	MySQL 9 標準サーバー
距離計算	完全サポート	HeatWave専用
インデックス	HNSW/IVFFlat	作成不可
最大次元数	16,000	16,383
類似度検索	高速	アプリ層で実装必要

ベクトル距離の視覚的理解

2次元空間でのベクトル距離

%%{init: {'theme': 'base', 'themeVariables': { 'background': 'transparent', 'primaryColor': 'transparent', 'primaryBorderColor': '#ffffff', 'primaryTextColor': '#ffffff', 'lineColor': '#ffffff', 'arrowheadColor': '#ffffff', 'edgeLabelBackground': '#3D3D5C' }}}%%

graph LR
subgraph "2次元ベクトル空間"
O[原点 (0,0)]
A["赤いワンピース
(0.8, 0.6)"]
B["クリムゾンドレス
(0.75, 0.65)"]
C["青いTシャツ
(-0.3, -0.4)"]

    O -.->|ベクトルA| A
    O -.->|ベクトルB| B
    O -.->|ベクトルC| C

    A -.->|距離: 小| B
    A -.->|距離: 大| C
end

style A fill:#ff6b6b,stroke:#fff,stroke-width:2px,color:#fff
style B fill:#ff8e8e,stroke:#fff,stroke-width:2px,color:#fff
style C fill:#4ecdc4,stroke:#fff,stroke-width:2px,color:#fff
style O fill:#666,stroke:#fff,stroke-width:2px,color:#fff

ポイント

近い距離: 「赤いワンピース」と「クリムゾンドレス」→ 類似した意味
遠い距離: 「赤いワンピース」と「青いTシャツ」→ 異なる意味
実際は1536次元: 人間には想像困難だが、コンピュータは正確に計算

商品名	次元1	次元2	次元3	次元4	次元5
赤いワンピース	0.023	-0.157	0.089	0.213	-0.046
クリムゾンドレス	0.031	-0.149	0.095	0.198	-0.052
真紅のワンピース	0.028	-0.162	0.087	0.221	-0.041
青いTシャツ	-0.156	-0.089	0.034	0.067	0.123

順位	商品名	類似度スコア	解釈
1位	赤いワンピース	1.00	完全一致（同じ商品）
2位	真紅のワンピース	0.92	非常に類似（色+形状）
3位	クリムゾンドレス	0.89	高い類似性（色+関連形状）
4位	ルビーレッドワンピース	0.85	高い類似性（色+形状）
5位	ワインレッドドレス	0.78	中程度の類似性（色系統）
6位	赤色のスカート	0.65	中程度の類似性（色のみ）
7位	青いTシャツ	0.21	低い類似性（異なる色）

項目	標準MySQL	HeatWave
VECTOR型	利用可能	利用可能
距離計算	PHP実装	DISTANCE関数
パフォーマンス	中小規模で実用的	大規模で高速
コスト	低い	高い
環境	どこでも	クラウド限定
柔軟性	高い	標準化された

シナリオ	データ規模	予算	推奨アプローチ	理由
スタートアップ	~10万件	低	標準MySQL + PHP	初期コスト抑制、柔軟性
中規模EC	~100万件	中	標準MySQL + 最適化	バランス重視
大規模サービス	1000万件+	高	HeatWave	パフォーマンス最優先
実験・検証	任意	低	標準MySQL + PHP	学習コスト最小

MySQL9でベクトルカラム登場！PHP×AWSでのAI/類似検索はこう変わる

結論

PostgreSQL+pgvectorを使おう・・・

なぜその結論か？説明していきます！

なぜその結論か？説明していきます！

1. ベクトルカラムがなぜ必要か？

2. ベクトル検索の構成要素は？

3. AWS+MySQLでは具体的にどのように利用するか？

今日のゴール: MySQL9のベクトル検索を理解し、実装判断ができるようになる

なぜその結論か？説明していきます！

1. ベクトルカラムがなぜ必要か？ ←←←

2. ベクトル検索の構成要素は？

3. AWS+MySQLでは具体的にどのように利用するか？

ベクトルカラムがなぜ必要か？

ベクトルカラムがなぜ必要か？

なぜベクトル検索が必要なのか？

現実的な課題から解決策の価値を理解する

こんな課題はありませんか？

こんな課題はありませんか？

現実的なECサイト検索シナリオ

実際のユーザー検索パターン

こんな課題はありませんか？

現実的なECサイト検索シナリオ

ユーザーが期待する検索結果

こんな課題はありませんか？

現実的なECサイト検索シナリオ

実際によく起こる問題

従来手法の限界を実際の検索結果で検証

従来手法の限界を実際の検索結果で検証

ECサイトっぽいデータベースでテスト

テストデータ（商品マスタ）

従来手法の限界を実際の検索結果で検証

LIKE検索の場合

従来手法の限界を実際の検索結果で検証

LIKE検索の場合

検索結果（実際のデータ例）

従来手法の限界を実際の検索結果で検証

全文検索の場合

従来手法の限界を実際の検索結果で検証

全文検索の場合

検索結果（実際のデータ例）

従来手法の限界を実際の検索結果で検証

全文検索の場合

全文検索の限界

ベクトル検索について検証

ベクトル検索について検証

ベクトル検索の場合

同じクエリ「赤いワンピース」での検索結果

ベクトル検索について検証

ベクトル検索の場合

検索結果（実際のベクトル類似度計算）

ベクトル検索について検証

ベクトル検索の場合

検索結果（実際のベクトル類似度計算）

ベクトル検索の優位性

[結果]ユーザーの期待に応えられない検索体験体験的にベクトルカラムがあった方が良い

結果:ユーザーの期待に応えられない検索体験

想定されるユーザー行動

検索失敗の影響

ビジネスへの影響

[検索の場合]離脱リスクの課題を解決する1つの方法が ベクトル検索

ここまでのまとめ

ここまでのまとめ

1. ベクトルカラムがなぜ必要か？

全文検索でもLIKE検索でも実現できない意味の近さを使った検索を実現するため

なぜその結論か？説明していきます！

1. ベクトルカラムがなぜ必要か？

2. ベクトル検索の構成要素は？←←←

3. AWS+MySQLでは具体的にどのように利用するか？

2. ベクトル検索の構成要素は？

ベクトル検索の構成要素は？

1. テキストを数値(ベクトル)化するモデル

2. ベクトルを保存するストレージ

3. クエリとストレージから類似度を計算する処理

1. テキストを数値(ベクトル)化するモデル

MLのモデルを使ってテキストを数値化(ベクトル)する

AIが言葉の意味を数値で表現する

1. テキストを数値(ベクトル)化するモデル

MLのモデルを使ってテキストを数値化(ベクトル)する

言葉の意味を数値(ベクトル)で表現する

MySQL9でベクトルカラム登場！
PHP×AWSでのAI/類似検索はこう変わる

[結果]
ユーザーの期待に応えられない検索体験
体験的にベクトルカラムがあった方が良い

[検索の場合]
離脱リスクの課題を解決する1つの方法が
ベクトル検索

全文検索でもLIKE検索でも実現できない
意味の近さを使った検索を実現するため

※このベクトルは言語ごとに違います。テストに出るよ!
(i18n対応に影響あり)

大敗してるのに使う方法
考えるんですか・・・？

はい。
DBを切り替えずにユーザーに
体験させたいとかあるはず

3. 既存のPHPアプリケーションでベクトル計算
だけ一旦考える

ベクトルで計算する際は
コサイン類似度やユークリッド距離などを
使うことが多い

実装に入る前にMySQL9で標準で使える
ベクトル系の標準関数を確認