このトピックでは、DashVector クラスタの仕様と、ビジネス要件に基づいてクラスタを選択する方法について説明します。
クラスタタイプ
DashVector は、さまざまなビジネスシナリオのニーズを満たすために、次の 3 つのタイプのクラスタを提供します。
パフォーマンス最適化タイプ: パフォーマンス最適化タイプのクラスタは、高い QPS と低いクエリレイテンシが要求されるシナリオに適しています。このタイプのクラスタは、最高の書き込み効率も提供します。高い同時実行性、高トラフィック、低レイテンシ、または高い書き込み効率が要求されるシナリオでは、パフォーマンス最適化タイプのクラスタをお勧めします。
ストレージ最適化タイプ(推奨): ストレージ最適化タイプのクラスタは、パフォーマンス最適化タイプのクラスタの 5 倍のストレージ容量を備えており、より多くのベクトルデータを保存および管理できるため、大量のデータを持つシナリオに適しています。ストレージ最適化タイプのクラスタは優れた技術指標を提供し、ほとんどのシナリオの要件を満たすことができます。このタイプは、最も費用対効果が高いタイプとして推奨されます。
無料トライアル: 無料トライアルクラスタは、テストおよび体験シナリオに適用可能であり、オンライン本番環境では使用できません。無料トライアルクラスタは 1 か月間有効で、有効期限が切れた後に別のトライアルを申請できます。無料トライアルクラスタには一定の制限があります。詳細については、「制限」をご参照ください。
無料トライアルタイプのクラスタは 1 か月間有効です。無料トライアル期間が終了すると、クラスタは自動的に解放され、クラスタ内のすべてのデータは削除され、復元できません。クラスタをより長く有効に保つには、無料トライアルクラスタの作成から 30 日以内に、無料トライアルタイプのクラスタを有料クラスタにアップグレードしてください。Alibaba Cloud は、有料クラスタにアップグレードされなかった無料トライアルクラスタの有効期限切れによって引き起こされるデータの削除について責任を負いません。
クラスタ仕様
DashVector は、主にストレージ容量が異なるさまざまな仕様のクラスタを提供します。
より高い仕様のクラスタが必要な場合、フィードバックがある場合、またはより多くの技術サポートを受けたい場合は、次の方法でお気軽にお問い合わせください。
公式 DingTalk グループ: 25130022704
テクニカルサポートのメールアドレス: dashvector@service.aliyun.com
ストレージ容量に関するリファレンス
クラスタタイプ | クラスタ仕様 | ドキュメント数(768 次元の FP32 ベクトルに基づく) | ドキュメント数(1,536 次元の FP32 ベクトルに基づく) |
パフォーマンス最適化タイプ | P.small | 500,000 | 250,000 |
P.large | 1,000,000 | 500,000 | |
P.2xlarge | 2,000,000 | 1,000,000 | |
P.4xlarge | 4,000,000 | 2,000,000 | |
P.8xlarge | 8,000,000 | 4,000,000 | |
P.16xlarge | 16,000,000 | 8,000,000 | |
ストレージ最適化タイプ | S.small | 2,500,000 | 1,250,000 |
S.large | 5,000,000 | 2,500,000 | |
S.2xlarge | 10,000,000 | 5,000,000 | |
S.4xlarge | 20,000,000 | 10,000,000 | |
S.8xlarge | 40,000,000 | 20,000,000 | |
S.16xlarge | 80,000,000 | 40,000,000 |
上記の表のデータは容量テストによって検証されていますが、参考値です。
上記の容量テストで使用されたドキュメントには、フィールドは含まれず、主キーとベクトルのみが含まれています。主キーは、ゼロベースの自動インクリメントの正の整数から変換された文字列です。ほとんどの実際の本番シナリオでは、フィールドは不可欠であり、ストレージ容量を占有します。したがって、実際のケースでは、保存できるドキュメント数は、上記の表に示されている数よりも少なくなります。
検索パフォーマンスに関するリファレンス
クラスタタイプ | クラスタ仕様 | topk=10 | topk=100 | topk=250 | topk=1000 | ||||
QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | ||
パフォーマンス最適化タイプ | P.large(100 万個の 768 次元の FP32 ベクトルに基づく) | 962.6 | < 30 ms | 429.7 | < 30 ms | 387.5 | < 45 ms | 134.7 | < 250 ms |
ストレージ最適化タイプ | S.large(500 万個の 768 次元の FP32 ベクトルに基づく) | 297.6 | < 30 ms | 112.5 | < 30 ms | 107.4 | < 50 ms | 37.1 | < 300 ms |
上記の表のデータは、Cohere データセットに基づく実際のパフォーマンステストから取得されていますが、異なるデータセットのデータ分布の影響を受ける可能性があるため、参考値です。
上記のパフォーマンステストで使用されたドキュメントには、フィールドは含まれず、主キーとベクトルのみが含まれています。主キーは、ゼロベースの自動インクリメントの正の整数から変換された文字列です。
DashVector は、バックエンドのベクトルインデックスをスケジュールに従って最適化します。最適化は通常、データが書き込まれてから 4 時間後に完了し、その時点でパフォーマンスが最適になります。
すべてのクラスタ仕様について、データが満杯の場合、QPS は上記の表に示されている値以上であり、データ量の増加によって減少することはありません。たとえば、 top 100 リクエストの QPS は、200 万個の 768 次元の FP32 ベクトルが P.2xlarge クラスタのすべてのストレージ容量を占有している場合でも、600 以上の値に達する可能性があります。
レプリカ数
DashVector では、レプリカ数を 1 ~ 5 の範囲の整数に設定できます。すべてのレプリカのデータは同じです。QPS はレプリカ数に比例して高くなります。一方、レプリカが多いほど、サービスの可用性が高くなります。本番環境でサービスの可用性に対する要件が高い場合は、少なくとも 2 つのレプリカを使用することをお勧めします。
レプリカ数の変更は、QPS とサービスの可用性にのみ影響し、ストレージ容量には影響しません。