Lindorm Distributed Processing System (LDPS) から SQL を使用して、LindormTable のワイドテーブルのデータを読み書きします。
前提条件
開始する前に、以下を確認してください。
SQL を使用して LindormTable にアクセスするための注意事項をお読みください。
ジョブの種類に応じて必要なリソースが初期化されていること:
JDBC: アプリケーション開発での JDBC の使用
Java ジョブ: Java でのジョブの作成
Python ジョブ: Python でのジョブの作成
ワイドテーブルのデータへのアクセス
LindormTable のワイドテーブルには、LDPS の lindorm_table カタログを介してアクセスできます。LDPS は、ワイドテーブルに対するデータ操作言語 (DML) 操作をサポートしています。データ定義言語 (DDL) 操作とパーティショニングはサポートされていません。
一般的なワークフローは、lindorm_table カタログに切り替え、テーブルスキーマを確認してから、DML 文を実行するという流れになります。
カタログへの切り替え
USE lindorm_table;テーブルスキーマのクエリ
SHOW CREATE TABLE test;出力は次のようになります:
+----------------------------------------------------+
| CREATE TABLE default.test ( |
| `id` INT, |
| `name` STRING) |
| |
+----------------------------------------------------+データの挿入
INSERT INTO test VALUES (0, 'Jay');データのクエリ
SELECT * FROM test;サポートされている SQL 構文の完全なリストについては、「DML ステートメント」をご参照ください。
データの一括インポート (パブリックプレビュー)
SQL 構文は、標準の INSERT 文と同じです。バルクロードが有効な場合、LDPS はインポートされたデータから直接ワイドテーブルファイルを生成して登録するため、書き込みスループットが向上します。
インポートを実行する前に、次のパラメーターを設定します:
| パラメーター | 説明 | デフォルト |
|---|---|---|
spark.sql.catalog.lindorm_table.bulkLoad.enabled | バルクロード機能を有効にします。有効にするには true に設定します。 | false |
spark.sql.catalog.lindorm_table.bulkLoad.parallelFactor | ワイドテーブルの単一リージョンにデータを書き込むために使用される同時セッション数。 | 4 |
バルクロードジョブによってインポートされたデータに対して、セカンダリインデックスと検索インデックスは自動的に作成されません。
次のステップ
DML 構文の完全なリファレンスを参照します:「DML ステートメント」