Tablestore Java SDK ベクトル検索 - Tablestore - Alibaba Cloud ドキュメントセンター

KnnVectorQuery を使用して、数値ベクトルによる近似最近傍探索を実行し、大規模なデータセット内で最も類似したデータ項目を検索します。

前提条件

Tablestore クライアントの初期化が完了していること。
データテーブルに多次元インデックスを作成し、ベクトルフィールドが設定されていること。

注意事項

ベクトル検索機能は、Tablestore SDK for Java 5.17.0 以降でサポートされています。正しい SDK バージョンがインストールされていることを確認してください。
説明
Tablestore SDK for Java のバージョン履歴の詳細については、「Java SDK のバージョン履歴」をご参照ください。
ベクトルフィールドのタイプ、ディメンション、およびその他のプロパティの数には制限があります。詳細については、「多次元インデックスの制限」をご参照ください。
多次元インデックスはサーバー側でパーティション分割されます。各パーティションは独自の TopK 最近傍を返し、結果はクライアントノードで集約されます。したがって、トークンを使用してすべてのデータをページングする場合、返される行の総数はサーバー側のパーティション数に依存します。

パラメーター

パラメーター	必須	説明
fieldName	はい	ベクトルフィールドの名前。
topK	はい	返す最近傍の数。最大値については、「多次元インデックスの制限」をご参照ください。重要 K の値を大きくすると再現率は向上しますが、クエリのレイテンシーとコストが増加します。
float32QueryVector	はい	類似検索に使用するベクトル。
minScore	いいえ	スコアのしきい値。この値より大きいスコアを持つ行のみを返します。値は 0 以上である必要があります。デフォルト値は 0 です。
filter	いいえ	ベクトル以外のクエリ条件の任意の組み合わせをサポートするクエリフィルター。

例

この例では、指定されたベクトルに最も近い 10 個の近傍をクエリします。このクエリでは、0.1 より大きい類似度スコアが必要で、Col_Keyword 列が 'hangzhou' であり、Col_Long 列が 4 未満の項目をフィルターします。

private static void knnVectorQuery(SyncClient client) {
    SearchQuery searchQuery = new SearchQuery();
    KnnVectorQuery query = new KnnVectorQuery();
    query.setFieldName("Col_Vector");
    query.setTopK(10); // 上位 K 個の最近傍を返します。
    query.setMinScore(0.1f); // スコアが 0.1 より大きい行のみを返します。
    query.setFloat32QueryVector(new float[]{0.1f, 0.2f, 0.3f, 0.4f});
    // 最近傍は、Col_Keyword = 'hangzhou' AND Col_Long < 4 という条件も満たす必要があります。
    query.setFilter(QueryBuilders.bool()
            .must(QueryBuilders.term("Col_Keyword", "hangzhou"))
            .must(QueryBuilders.range("Col_Long").lessThan(4))
    );
    searchQuery.setQuery(query);
    searchQuery.setLimit(10);
    // 結果をスコアでソートします。
    searchQuery.setSort(new Sort(Collections.singletonList(new ScoreSort())));
    SearchRequest searchRequest = new SearchRequest("<TABLE_NAME>", "<SEARCH_INDEX_NAME>", searchQuery);
    SearchRequest.ColumnsToGet columnsToGet = new SearchRequest.ColumnsToGet();
    columnsToGet.setColumns(Arrays.asList("Col_Keyword", "Col_Long"));
    searchRequest.setColumnsToGet(columnsToGet);
    // 検索操作を呼び出します。
    SearchResponse resp = client.search(searchRequest);
    for (SearchHit hit : resp.getSearchHits()) {
        // スコアを出力します。
        System.out.println(hit.getScore());
        // 行データを出力します。
        System.out.println(hit.getRow());
    }
}

よくある質問

Tablestore でのベクトル検索パフォーマンスの最適化

Tablestore:ベクトル検索

前提条件

注意事項

パラメーター

例

よくある質問

関連トピック