DataWorksでHologresタスクを開発および管理するには、まずHologresインスタンスを目的のDataWorksワークスペースにデータソースとして追加する必要があります。これにより、DataWorksのさまざまなサービスでHologresデータソースを使用し、データ同期、データ開発、データ分析などの操作をHologresデータソースに基づいて実行できます。
前提条件
Hologresインスタンスが作成され、Hologresインスタンス用にデータベースが作成されています。詳細については、「Hologresインスタンスを購入する」および「データベースを作成する」をご参照ください。
説明Hologresデータソースを追加するワークスペースと同じ [リージョン] にHologresインスタンスを作成することをお勧めします。リージョンが異なる場合は、リージョンをまたがるデータソースのみをワークスペースに追加できます。データソースはDataWorks DataStudioに関連付けることができません。これは、データソースをDataStudioまたはオペレーションセンターでコンピューティングタスクを実行するために使用できないことを示します。データソースはデータ同期にのみ使用できます。
必要なリソースグループが購入され、構成されています。
Hologresデータソースが追加されると、データ同期、コンピューティングタスクの開発とスケジューリング、DataService Studio APIの生成などのシナリオでデータソースを使用できます。汎用目的で使用される新バージョンのリソースグループは、上記のすべてのシナリオの要件を満たすことができます。ビジネス要件に基づいて専用リソースグループを購入する必要があります。たとえば、Data Integration専用の排他的リソースグループ、スケジューリング専用の排他的リソースグループ、DataWorksのDataService Studio専用の排他的リソースグループを購入できます。汎用リソースグループを使用することをお勧めします。Hologresデータソースの使用シナリオに基づいて、必要なリソースグループを購入および構成し、データソースとリソースグループ間のネットワーク接続を事前に確立する必要があります。リソースグループの詳細については、「リソースグループの管理」をご参照ください。
説明Hologresデータソースは、汎用リソースグループと専用リソースグループのみをサポートします。
DataWorksワークスペースが作成されているか、使用するアカウントが目的のワークスペースにメンバーとして追加されています。
目的のHologresインスタンスをワークスペースにデータソースとして追加する必要があります。これにより、データソースを使用してワークスペースでデータ開発操作を実行できます。さらに、購入したリソースグループをワークスペースに関連付け、リソースグループとデータソース間のネットワーク接続を確立する必要があります。ワークスペースの作成方法については、「ワークスペースの作成と管理」をご参照ください。
説明同じHologresインスタンスを複数のワークスペースにデータソースとして追加できます。
制限事項
Hologresデータソースが次の条件を満たしている場合にのみ、DataWorks DataStudioに関連付けることができます。Hologresデータソースの追加の基になっているHologresインスタンスが、ワークスペースと同じリージョンにあり、同じAlibaba Cloudアカウントに属しており、HologresデータソースでSSL暗号化が有効になっていません。これにより、Hologresデータソースをデータ開発またはタスクスケジューリングに使用できます。
重要データソースとして追加するHologresインスタンスで伝送暗号化が有効になっている場合は、Hologresインスタンスをデータソースとして追加するときにSSL認証を有効にできます。ただし、SSL認証が有効になっているHologresデータソースは、データ開発またはタスクスケジューリングに使用できません。
現在のAlibaba Cloudアカウントに属していないHologresインスタンスを、現在のAlibaba Cloudアカウント内のワークスペースにデータソースとして追加する場合、RAMロールのみを使用して関連するHologresインスタンスにアクセスできます。アカウントをまたがって追加されたHologresデータソースは、データ開発またはタスクスケジューリングに使用できません。
Hologresデータソース用に構成されたHologresタスクを実行するには、専用リソースグループまたは汎用リソースグループのみを使用できます。詳細については、「汎用リソースグループの作成と使用」および「旧バージョンのリソースグループを使用する」をご参照ください。
準備:権限の説明と構成
DataWorks側で必要な権限を構成します。
HologresデータソースをDataWorksに追加する前に、Alibaba Cloudアカウントにデータソースを追加するために必要な権限があることを確認する必要があります。アカウントは、次のいずれかの条件を満たしている必要があります。
アカウントはAlibaba Cloudアカウントです。
RAMユーザーまたはRAMロールとしてデータソースを追加する場合、RAMユーザーまたはRAMロールには
AliyunDataWorksFullAccess
ポリシーがアタッチされています。詳細については、「RAMユーザーに権限を付与する」および「RAMロールに権限を付与する」をご参照ください。RAMユーザーまたはRAMロールとしてデータソースを追加する場合、RAMユーザーまたはRAMロールには、[ワークスペースオーナー]、[O&M]、または [ワークスペース管理者] ロールが割り当てられています。詳細については、「RAMユーザーをワークスペースにメンバーとして追加し、メンバーにロールを割り当てる」をご参照ください。
説明RAMユーザーとしてデータソースを追加する場合、DataWorksは デフォルトアクセスID パラメーターの値に基づいて、アカウントに他の権限が必要かどうかを判断します。
[デフォルトアクセスID] パラメーターを [エグゼキューター] に設定した場合、追加の権限は必要ありません。
[デフォルトアクセス ID] パラメーターを Alibaba Cloud アカウント、Alibaba Cloud RAM ロール、または Alibaba Cloud RAM ユーザー に設定した場合、RAM ユーザーに
AdministratorAccess
ポリシーをアタッチする必要があります。
Hologres側で必要な権限を構成します。
Hologresデータソースが追加された後、データソースに指定された [デフォルトアクセスID] を使用して、関連するHologresインスタンスにアクセスする必要があります。デフォルトアクセスIDに対応するAlibaba Cloudアカウントに、Hologresインスタンスに対する操作権限があることを確認する必要があります。Hologresインスタンスの権限と、ユーザーにHologresインスタンスの権限を付与する方法については、「Hologres権限モデル」をご参照ください。
データソースを追加する
データソースページに移動します。
DataWorksコンソール にログオンします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションペインで、 を選択します。表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[管理センターに移動] をクリックします。
SettingCenterページの左側のナビゲーションペインで、
を選択します。
データソースページで、[データソースを追加] をクリックします。「データソースを追加」ダイアログボックスで、[hologres] をクリックします。表示されるページで、パラメーターを構成します。
Hologresデータソースの情報を構成します。
「基本情報」セクションで、データソース名などのパラメーターを構成します。次の表は、構成する必要のあるパラメーターについて説明しています。
説明標準モードのワークスペースを使用する場合は、開発環境と本番環境で別々にデータソースを追加する必要があります。ワークスペースモードの詳細については、「基本モードのワークスペースと標準モードのワークスペースの違い」をご参照ください。
パラメーター
説明
データソース名
DataWorksでのデータソースの名前。名前は、現在のテナント内で一意である必要があります。
認証方法
新しいデータソースの場合、このパラメーターの値はAlibaba CloudアカウントとAlibaba Cloud RAMロールに固定されています。
説明既存のデータソースが [アクセスキーペア] を使用して追加されている場合は、データソースのこのパラメーターの値を [alibaba Cloudアカウントとalibaba Cloud RAMロール] に変更することをお勧めします。
Alibaba Cloudアカウント
使用するHologresインスタンスが現在のAlibaba Cloudアカウントに属しているか、別のAlibaba Cloudアカウントに属しているかを指定します。有効な値:
[現在のalibaba Cloudアカウント]:Hologresインスタンスは現在のAlibaba Cloudアカウントに属しています。
[別のalibaba Cloudアカウント]:Hologresインスタンスは別のAlibaba Cloudアカウントに属しています。
説明このパラメーターを「別のAlibaba Cloudアカウント」に設定した場合、アカウントをまたがってHologresデータソースを追加する必要があります。Hologresデータソースが追加されると、RAMロールのみを使用して関連するHologresインスタンスにアクセスできます。
リージョン
使用するHologresインスタンスが存在するリージョン。
説明選択したリージョンがワークスペースが存在するリージョンと異なる場合、データソースをDataWorks DataStudioに関連付けることはできません。これは、データソースをDataStudioまたはオペレーションセンターで使用できず、データ同期のためにData Integrationでのみ使用できることを示します。
Hologresインスタンス、デフォルトアクセスIDなどのその他のパラメーター
構成する必要のあるその他のパラメーターは、「Alibaba Cloudアカウント」パラメーターの値によって異なります。
現在のAlibaba Cloudアカウント
Hologresインスタンス と データベース名:「Hologresインスタンス」ドロップダウンリストからデータソースとして追加するHologresインスタンスを選択し、「データベース名」フィールドに目的のHologresデータベースの名前を入力します。Hologresコンソール にログオンし、Hologresインスタンスの詳細ページでHologresインスタンスとデータベースの情報を取得できます。
デフォルトアクセスID:データソースにアクセスするために使用されるデフォルトアクセスID。
開発環境:このパラメーターの値は [エグゼキューター] に固定されています。エグゼキューターは現在のログオンアカウントを示します。
たとえば、DataWorksコンソールのDataStudioページでHologresタスクを作成およびデバッグする場合、Hologresにアクセスするために使用されるデフォルトアクセスIDは、DataWorksコンソールにログオンするために使用されるAlibaba Cloudアカウントです。
本番環境:このパラメーターの値は、Alibaba Cloudアカウント、Alibaba Cloud RAMユーザー、またはAlibaba Cloud RAMロールです。
説明RAMロールを使用して操作を実行する方法については、「(詳細) RAMロールを使用してDataWorksコンソールにログオンし、DataWorksを使用する」をご参照ください。
「デフォルトアクセスID」ドロップダウンリストに表示されるデフォルトアクセスIDは、Hologresデータソースを追加するために使用するアカウントによって異なります。
Hologresタスクがオペレーションセンターで定期的にスケジュールされている場合、選択したデフォルトアクセスIDを使用して関連するHologresインスタンスにアクセスします。
別のAlibaba Cloudアカウント
説明アカウントをまたがってHologresデータソースを追加する場合、このパラメーターを「別のAlibaba Cloudアカウント」に設定する必要があります。Hologresデータソースが追加されると、RAMロールのみを使用して関連するHologresインスタンスにアクセスできます。アカウントをまたがって追加されたHologresデータソースは、データ開発またはタスクスケジューリングに使用できません。
Alibaba Cloudアカウントのuid と RAMロール:データソースとして追加するHologresインスタンスが属するAlibaba CloudアカウントのUIDを「Alibaba CloudアカウントのUID」フィールドに入力し、Hologresインスタンスにアクセスするために使用するRAMロールを「RAMロール」フィールドに入力します。RAMロールを使用してHologresインスタンスにアクセスする必要があります。
Hologresインスタンス と データベース名:現在のワークスペースにデータソースとして追加するHologresインスタンスのIDを「Hologresインスタンス」フィールドに入力し、目的のHologresデータベースの名前を「データベース名」フィールドに入力します。Hologresコンソール にログオンし、Hologresインスタンスの詳細ページでHologresインスタンスとデータベースの情報を取得できます。
認証方法 と SSL暗号化
HologresデータソースのSSL認証を有効にするかどうか、およびHologresデータソースの伝送暗号化を実装するかどうかを指定します。
「認証方法」パラメーターを [SSL認証] に設定する場合、使用するHologresインスタンスで伝送暗号化が有効になっていることを確認する必要があります。Hologresインスタンスで伝送暗号化が有効になっておらず、「認証方法」パラメーターを「SSL認証」に設定した場合、Hologresインスタンスにアクセスするときにエラーが報告されます。
重要HologresデータソースのSSL認証を有効にした場合、追加された後、Hologresデータソースをデータ開発またはタスクスケジューリングに使用することはできません。
Hologresデータソースとリソースグループ間のネットワーク接続をテストします。
DataWorksによって提供されるリソースグループは、リソースグループの使用シナリオに基づいて、[data Integration用リソースグループ]、[スケジューリング用リソースグループ]、[dataservice Studio用リソースグループ] に分類できます。これらのリソースグループの詳細については、「概要」をご参照ください。
「接続構成」セクションで使用するリソースグループを見つけ、データソースとリソースグループ間のネットワーク接続をテストできます。ネットワーク接続テストが失敗した場合、データソースを使用するタスクを実行できません。
次の手順
データ開発の円滑さを確保するために、関連する操作を実行する前に、「DataWorksでのHologresタスク開発の使用上の注意」を読んで、DataWorksでのHologresの使用手順、Hologresを使用したデータ開発の料金、環境の準備、権限管理などの情報を理解することをお勧めします。
データソースが追加された後、ビジネス要件に基づいて次の操作を実行できます。
DataWorks DataStudioとオペレーションセンターは、Hologresタスクの開発とスケジューリングの機能を提供します。Hologresデータソースに基づいてHologresタスクを開発する場合、またはHologresタスクを定期的にスケジュールする場合は、DataWorksコンソールのDataStudioページに移動し、Hologresデータソースをコンピューティングリソースに関連付ける必要があります。
説明データソースが追加されるワークスペースと同じリージョンにあり、同じAlibaba Cloudアカウントに属しているHologresインスタンスに基づいてデータソースが追加されている場合にのみ、HologresデータソースをDataStudioに関連付けることができます。
DataWorks Data Integrationは、Hologresデータソースからデータを読み書きするためのHologresリーダーとHologresライターを提供します。ビジネス要件に基づいて、DataStudioでHologresデータソースのバッチまたはリアルタイム同期タスクを構成するか、Data IntegrationでHologresデータソースの同期タスクを構成して、データ同期を実行できます。
データソースを管理する:SettingCenterのデータソースページに移動して、データソースの管理操作を実行できます。たとえば、データソースを変更または削除できます。