MaxCompute では、MaxCompute プロジェクトを Davinci に接続できます。 Davinci UI 上のシンプルな構成に基づいて、さまざまなデータ可視化アプリケーションを使用できます。 このトピックでは、MaxCompute Java Database Connectivity(JDBC)ドライバーを使用して Davinci を MaxCompute プロジェクトに接続し、データを視覚的に分析する方法について説明します。
背景情報
Davinci は、ビジネスパーソン、データエンジニア、データアナリスト、データサイエンティスト向けのエンドツーエンドのデータ可視化ソリューションです。 Davinci UI 上のシンプルな構成に基づいてデータを分析できます。 また、高度なインタラクション、業界分析、パターン探索、ソーシャルインテリジェンスなどの機能も実装できます。 Davinci の詳細については、「Davinci」をご参照ください。
前提条件
以下の条件が満たされていることを確認してください。
MaxCompute プロジェクトが作成されている。
詳細については、「MaxCompute プロジェクトを作成する」をご参照ください。
MaxCompute プロジェクトへのアクセスに使用する Alibaba Cloud アカウントの AccessKey ID と AccessKey シークレットを取得している。
アクセスキーのペア ページで AccessKey ID を取得できます。
MaxCompute JDBC ドライバー V3.0.1 以降の JAR パッケージ をダウンロードしている。 このパッケージには、
jar-with-dependenciesパッケージが含まれています。説明このトピックでは、MaxCompute JDBC ドライバー V3.2.9 を使用します。
Davinci がインストールおよび構成されている。
Davinci のインストールと構成方法の詳細については、「Davinci のインストールと構成」をご参照ください。 また、Docker を使用して Davinci をインストールし、MaxCompute JDBC ドライバーをマウントすることもできます。
Davinci を構成し、MaxCompute JDBC ドライバーをマウントする際は、MaxCompute が正しく構成されていることを確認してください。 詳細については、「Davinci の構成とドライバーのマウントに関する注意事項」をご参照ください。
Davinci の構成とドライバーのマウントに関する注意事項
Davinci を構成し、ドライバーをマウントする際は、以下の構成が有効であることを確認してください。
メール構成
# config ディレクトリの application.yml ファイルの情報を構成します。 mail: # 簡易メール転送プロトコル(SMTP)エンドポイント。 host: # SMTP サービスポート。 port: # 個人のメールアドレス。 username: # 不要。 fromAddress: # 個人のメールアドレスの認証コード。 この情報はメールアドレスのパスワードではありません。 password: # メールアドレスのニックネーム(例:Davinci)。 nickname: # 以下の設定項目にはデフォルト値を保持します。 properties: smtp: starttls: enable: true required: true auth: true mail: smtp: ssl: enable: trueカスタムデータソース構成
Davinci の公式ドキュメントに記載されている手順に基づいて Davinci をインストールする場合は、カスタムデータソース構成ファイル datasource_driver.yml を開き、以下の情報を構成します。
odps: name: odps desc: odps version: driver: com.aliyun.odps.jdbc.OdpsDriver keyword_prefix: keyword_suffix: alias_prefix: \` alias_suffix: \`構成が完了したら、MaxCompute JDBC ドライバーの JAR パッケージを lib ディレクトリにコピーし、Davinci を再起動します。
Docker を使用して Davinci をインストールする場合は、データソース構成ファイル datasource_driver.yml を手動で作成し、
vim docker-compose.ymlコマンドを実行して構成ファイルを開く必要があります。 以下のサンプルコードは構成を示しています。volumes: - %odps-jdbc-x.x.x-jar-with-dependencies.jar のディレクトリ%/odps-jdbc-x.x.x-jar-with-dependencies.jar:/opt/davinci/lib/odps-jdbc-x.x.x-jar-with-dependencies.jar - %datasource_driver.yml のディレクトリ%/datasource_driver.yml:/opt/davinci/config/datasource_driver.ymlodps-jdbc-x.x.x-jar-with-dependencies.jarは、MaxCompute JDBC ドライバーの JAR パッケージの名前です(例:odps-jdbc-3.2.9-jar-with-dependencies.jar)。 構成が完了したら、Davinci を再起動します。
ステップ 1:Davinci を MaxCompute に接続する
Davinci が想定どおりにインストールおよび構成されていることを確認してください。 Davinci が起動に失敗した場合は、Davinci の構成情報を再度確認する必要があります。 詳細については、「Davinci の構成とドライバーのマウントに関する注意事項」をご参照ください。
Davinci を起動し、ログインします。
Davinci サービスページで、右上隅にある [作成] をクリックしてプロジェクトを作成し、保存します。
作成したプロジェクトに移動します。 左側のナビゲーションウィンドウで、
アイコンをクリックします。 表示されたページで、
アイコンをクリックします。 [ソースの追加] ダイアログボックスで、パラメーターを構成します。 次の表にパラメーターを示します。パラメーター
説明
名前
新しいデータソースの名前。 この名前は、システム内の異なるデータベースの接続を区別するために使用されます。
タイプ
MaxCompute プロジェクトにアクセスするために使用されるドライバー。 値を JDBC に設定します。
データベース
接続先のターゲットデータベースのタイプ。 値を odps に設定します。
ユーザー名
MaxCompute プロジェクトにアクセスするために使用される AccessKey ID。
アクセスキーのペア ページで AccessKey ID を取得できます。
パスワード
AccessKey ID に対応する AccessKey シークレット。
URL
MaxCompute プロジェクトへの接続に使用する URL。 フォーマットは
jdbc:odps:<Maxcompute_endpoint>?project=<Maxcompute_project_name>[&interactiveMode={true|false}]です。 このパラメーターを構成する際は、山かっこ(<>)を削除してください。 パラメーターのフォーマット:<MaxCompute_endpoint>:必須。 MaxCompute のエンドポイント。 MaxCompute プロジェクトが存在するリージョンに基づいて、このパラメーターを構成します。
さまざまなリージョンにおける MaxCompute のエンドポイントの詳細については、「エンドポイント」をご参照ください。
<MaxCompute_project_name>:必須。 MaxCompute プロジェクトの名前。
このパラメーターは、MaxCompute プロジェクトに対応する DataWorks ワークスペースではなく、MaxCompute プロジェクトの名前を指定します。 MaxCompute コンソール にログインし、上部のナビゲーションバーで MaxCompute プロジェクトが存在するリージョンを選択し、[ワークスペース] > [プロジェクト] を選択します。 これにより、MaxCompute プロジェクトの名前を表示できます。
interactiveMode:オプション。 このパラメーターは、MaxCompute Query Acceleration(MCQA)機能を有効にするかどうかを指定します。
MCQA 機能を有効にするには、URL の末尾に
&interactiveMode=trueを追加します。 MCQA 機能の詳細については、「クエリ高速化」をご参照ください。
[テスト] をクリックします。 接続に成功したら、[保存] をクリックします。
ステップ 2:Davinci を使用してデータをクエリおよび分析する
Davinci ビューを使用して、SQL テンプレートの管理、SQL 文の実行後に取得されるデータモデルの構成、行と列の権限の構成を行うことができます。 その後、ウィジェットを使用して、ビューによって提供されるデータモデルに基づいて SQL の結果をさらに集計およびグループ化できます。 処理されたデータは視覚的にエンコードできます。 以下の操作を実行できます。 詳細については、「Davinci ヘルプ」をご参照ください。
既存のすべてのテーブルをクエリする
データビューページで、右上隅にある
アイコンをクリックして SQL エディターを開き、作成したデータソースを選択してすべてのテーブルを表示します。テーブルスキーマをクエリする
データビューページで、右上隅にある
アイコンをクリックして SQL エディターに移動します。 作成したデータソースを選択し、SQL スクリプトを作成して実行し、[次へ] をクリックしてテーブルスキーマ情報を表示します。テーブルデータをクエリする
データビューページで、右上隅にある
アイコンをクリックして SQL エディターに移動します。 作成したデータソースを選択し、SQL スクリプトを作成し、[実行] をクリックしてテーブルデータを表示します。分析データを視覚化する
視覚化コンポーネントページで、右上隅にある
アイコンをクリックしてチャートエディターに移動します。 チャートタイプを選択し、プロパティを構成します。 その後、ビジネス要件に基づいてデータを分析できます。