高性能なベクトル検索はベクトルインデックスに依存し、インスタンスメモリに要件を課します。このトピックでは、一般的なディメンションのさまざまな量のベクトルデータに対する最小インスタンス仕様を提供します。
推奨されるインスタンス仕様
次の表は、1 つのテーブルに対して推奨される最小インスタンス仕様を示しています。ビジネスで必要な 1 秒あたりのクエリ数(QPS)とレイテンシに基づいて、インスタンスをスケールアウトすることをお勧めします。
テーブルに次の表に記載されているよりも多くの行が含まれている場合は、インスタンス仕様を比例的にスケールアウトすることをお勧めします。
完全一致に基づいてベクトル検索を実行する場合は、ベクトルインデックスを作成する必要はありません。次の表に基づいてインスタンス仕様をスケールアウトします。
ベクトル次元 | ベクトルテーブルの行数 | 推奨される最小インスタンス仕様 |
128 | 0.2 億未満 | 32 CPU コア |
0.2 億~ 0.4 億 | 64 CPU コア | |
0.4 億超 | 128 CPU コア以上 | |
256 | 6,000 万未満 | 32 CPU コア |
6,000 万~ 1 億 2,000 万 | 64 CPU コア | |
1 億 2,000 万超 | 128 CPU コア以上 | |
512 | 3,000 万未満 | 32 CPU コア |
3,000 万~ 6,400 万 | 64 CPU コア | |
6,400 万超 | 128 CPU コア以上 | |
768 | 2,400 万未満 | 32 CPU コア |
2,400 万~ 4,800 万 | 64 CPU コア | |
4,800 万超 | 128 CPU コア以上 | |
1024 | 1,600 万未満 | 32 CPU コア |
1,600 万~ 3,200 万 | 64 CPU コア | |
3,200 万超 | 128 CPU コア以上 | |
1536 | 1,000 万未満 | 32 CPU コア |
1,000 万~ 2,000 万 | 64 CPU コア | |
2,000 万超 | 128 CPU コア以上 |