DataWorks を使用して ClickHouse クラスターのタスクを開発および管理するには、まずクラスターを ClickHouse コンピューティングリソースとして追加する必要があります。追加後、このコンピューティングリソースを使用して、データ同期やデータ開発などの操作のために、さまざまな DataWorks モジュールから ClickHouse クラスターに接続できます。
前提条件
ClickHouse クラスターが作成済みであること。
説明DataWorks ワークスペースと同じ リージョンに ClickHouse クラスターを作成することを推奨します。
クラスターとワークスペースが異なるリージョンにある場合、クラスターはデータ同期タスクのクロスリージョンデータソースとしてのみ使用できます。Data Studio またはオペレーションセンターからコンピューティングタスクを実行するために使用することはできません。
DataWorks ワークスペースが作成されています。操作を実行する RAM ユーザーは、ワークスペースのメンバーであり、ワークスペース管理者ロールを持っています。
リソースグループがワークスペースに関連付けられ、ネットワーク接続が確立されていることを確認します。
サーバーレスリソースグループを使用する場合、リソースグループが ClickHouse コンピューティングリソースに接続できることを確認します。
レガシー専用リソースグループを使用する場合、シナリオに基づいて、ClickHouse コンピューティングリソースが関連する統合用の専用リソースグループ、専用スケジューリングリソースグループ、およびサービス用の専用リソースグループに接続できることを確認します。
デフォルトでは、ApsaraDB for ClickHouse クラスターはすべての IP アドレスからのアクセスを拒否します。コンピューティングリソースを関連付ける前に、DataWorks リソースグループの IP アドレスまたは CIDR ブロックを ClickHouse クラスターのホワイトリストに追加する必要があります。そうしないと、関連付けは失敗します。リソースグループのタイプに応じて、これはリソースグループに関連付けられている vSwitch CIDR ブロック、レガシーリソースグループの EIP、またはサーバーレスリソースグループに関連付けられている VPC の EIP になります。
説明vSwitch CIDR ブロック、レガシーリソースグループの EIP、またはサーバーレスリソースグループに関連付けられている VPC の EIP を取得する方法については、「DataWorks の IP アドレスをホワイトリストに追加」をご参照ください。
制限事項
機能制限:ClickHouse コンピュートエンジンで SSL 認証が有効になっている場合、データ開発または定期スケジューリングタスクには使用できません。
リージョン制限:中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)。
権限要件:
オペレーター
必要な権限
Alibaba Cloud アカウント
追加の権限は必要ありません。
RAM ユーザー/RAM ロール
O&M またはワークスペース管理者ロールを持つワークスペースメンバー、または
AliyunDataWorksFullAccess権限を持つメンバーのみがコンピューティングリソースを作成できます。詳細については、「ユーザーにワークスペース管理者の権限を付与」をご参照ください。
新しい Data Studio:ClickHouse リソースの関連付け
この手順は、新しいバージョンのData Development (Data Studio) を使用するするワークスペースに適用されます。
コンピューティングリソースページへの移動
DataWorks コンソールにログインします。上部のナビゲーションバーでリージョンを選択します。左側のナビゲーションウィンドウで、を選択します。ドロップダウンリストからワークスペースを選択し、Go to Management Centerをクリックします。
左側のナビゲーションウィンドウで、Computing Resourcesをクリックして、コンピューティングリソースページに移動します。
ClickHouse コンピューティングリソースの関連付け
コンピューティングリソースページで、ClickHouse コンピューティングリソースを設定して関連付けます。
コンピューティングリソースタイプを選択します。
コンピューティングリソースのバインドをクリックして、コンピューティングリソースのバインドページを開きます。
コンピューティングリソースのバインドページで、リソースタイプとして ClickHouse を選択し、ClickHouse コンピューティングリソースの関連付け設定ページを開きます。
ClickHouse コンピューティングリソースを設定します。
ClickHouse コンピューティングリソースの関連付けページで、次の表の説明に従ってパラメーターを設定します。
パラメーター
説明
設定モード
接続文字列モードのみがサポートされています。
JDBC URL
JDBC URL フォーマット:
jdbc:clickhouse://<ip>:<port>/<dbname>。<ip>:ご利用の ClickHouse クラスターの クラスター情報ページにある VPC エンドポイントまたは パブリックエンドポイント。例:
cc-bp1xxx..clickhouse.ads.aliyuncs.com。<port>:Authentication Methodが No Authenticationに設定されている場合、ClickHouse の クラスター情報ページにある VPC HTTP ポート (
8123) を使用します。Authentication Methodが SSL Authenticationに設定されている場合、ClickHouse の クラスター情報ページにある VPC HTTPS ポート (8443) を使用します。<dbname>:ClickHouse データベースの名前。デフォルト値は
defaultです。必要に応じて新しいデータベースを作成できます。
ユーザー名とパスワード
ご利用の ClickHouse クラスターのアカウントとパスワード。
認証方法
ClickHouse クラスターへの接続を認証する方法を指定します。
認証なし:他の設定は必要ありません。
SSL 認証:このオプションを選択した場合、検証のためにご利用の ClickHouse クラスターの クラスター情報ページから CA 証明書をダウンロードする必要があります。
説明ClickHouse コンピュートエンジンで SSL 認証が有効になっている場合、データ開発または定期スケジューリングタスクには使用できません。
SSL CA 証明書
このパラメーターは、認証方法がSSL 認証に設定されている場合にのみ必要です。Add authentication documentをクリックし、ご利用の ClickHouse クラスターの クラスター情報ページからダウンロードした CA 証明書をアップロードします。
コンピューティングリソースインスタンス名
コンピューティングリソースインスタンスのカスタム名を入力します。
ネットワーク接続をテストします。
接続設定エリアで、ClickHouse ノードの実行に使用するリソースグループを選択し、テスト接続をクリックします。これにより、リソースグループが ClickHouse クラスターにアクセスできることが保証されます。詳細については、「ネットワーク接続ソリューション」をご参照ください。
Confirmをクリックして設定を完了します。
レガシー Data Studio:ClickHouse リソースの関連付け
この手順は、レガシー 新しいバージョンのData Development (Data Studio) を使用するするワークスペースに適用されます。
コンピューティングリソースページへの移動
DataStudio ページに移動します。
DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、を選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、データ開発へをクリックします。
左側のナビゲーションウィンドウで、
アイコンをクリックして Computing Resourcesページを開きます。
ClickHouse コンピューティングリソースの関連付け
コンピューティングリソースページで、ClickHouse コンピューティングリソースを設定して関連付けます。
コンピューティングリソースタイプを選択します。
Create Computing Resourceをクリックして、Create Computing Resourceページに移動します。
Create Computing Resourceページで、コンピューティングリソースタイプとして ClickHouse を選択し、Create Computing Resource設定ページを開きます。
ClickHouse コンピューティングリソースを設定します。
Create Computing Resourceページで、次のパラメーターを設定します:
パラメーター
説明
データソース名
コンピューティングリソースのカスタム名を入力します。
設定モード
接続文字列モードのみがサポートされています。
ホストアドレス/IP
ご利用の ClickHouse クラスターの クラスター情報ページにある VPC エンドポイントまたは パブリックエンドポイント。例:
cc-bp1xxx..clickhouse.ads.aliyuncs.com。ポート
Authentication Methodが No Authenticationに設定されている場合、ご利用の ClickHouse クラスターの クラスター情報ページにある VPC HTTP ポート番号 (
8123) を使用します。Authentication Methodが SSL Authenticationに設定されている場合、ご利用の ClickHouse クラスターの クラスター情報ページにある VPC HTTPS ポート番号 (
8443) を使用します。データベース名
ClickHouse データベースの名前。デフォルト値は
defaultです。必要に応じて新しいデータベースを作成できます。ユーザー名とパスワード
ご利用の ClickHouse クラスターのアカウントとパスワード。
バージョン
関連付けるクラスターのバージョンを指定します。
詳細パラメーター
オプション。 Add Propertyをクリックして、追加のプロパティを設定できます。
認証方法
ClickHouse クラスターへの接続を認証するために使用する方法。
認証なし:他の設定は必要ありません。
SSL 認証:このオプションを選択した場合、検証のためにご利用の ClickHouse クラスターの クラスター情報ページから CA 証明書をダウンロードする必要があります。
説明ClickHouse コンピュートエンジンで SSL 認証が有効になっている場合、データ開発または定期スケジューリングタスクには使用できません。
SSL CA 証明書
このパラメーターは、認証方法がSSL 認証に設定されている場合にのみ必要です。Add authentication documentをクリックし、ご利用の ClickHouse クラスターの クラスター情報ページからダウンロードした CA 証明書をアップロードします。
ネットワーク接続をテストします。
接続設定エリアで、ClickHouse タスクの実行に使用するリソースグループを選択し、テスト接続をクリックします。これにより、リソースグループが ClickHouse クラスターにアクセスできることが保証されます。詳細については、「ネットワーク接続ソリューション」をご参照ください。
Create and Associate Computing Resource with DataStudioをクリックして設定を完了します。
次のステップ
Data Studio (新バージョン):ClickHouse コンピューティングリソースを設定した後、Data Studio でデータ同期のために バッチ同期ノードを、データ開発のために ClickHouse SQL ノードを使用できます。
レガシー Data Studio:ClickHouse コンピューティングリソースを設定した後、データ同期のために ノードを使用できます。
よくある質問
エラーメッセージ:not support data sync channel, error code: 0001.
ソリューション:JDBC URL にスペースや余分な文字がないか確認してください。
エラーメッセージ:ru.yandex.clickhouse.except.ClickHouseUnknownException: ClickHouse exception, code: 1002.
ソリューション:IP アドレスが正しいか確認してください。