このガイドでは、Quick BI に Spark SQL データソースを追加し、パブリックネットワークまたは Alibaba Cloud VPC 経由で Spark SQL データベース(バージョン 3.1.2)への接続を有効にするプロセスについて詳しく説明します。 この接続を確立することで、Quick BI 内でデータを分析および可視化できます。
前提条件
ネットワークが接続されていることを確認します。
パブリックネットワーク経由で Quick BI を Spark SQL データベース(バージョン 3.1.2)に接続するには、Quick BI の IP アドレス をデータベースのホワイトリストに追加する必要があります。 詳細については、「セキュリティグループルールを追加する方法」をご参照ください。
内部ネットワーク接続の場合は、次のいずれかの方法を使用します。
Spark SQL データベースが Alibaba Cloud ECS でホストされている場合は、Alibaba Cloud VPC 経由で接続を確立します。
または、ジャンプサーバーをデプロイし、SSH トンネルを作成してデータベースにアクセスします。
ユーザー作成の Spark SQL データベース(バージョン 3.1.2)のユーザー名とパスワードを取得します。
制限事項
Spark SQL データベースはバージョン 3.1.2 である必要があり、基盤となるストレージに使用される Hive MetaStore は Hive 2.0 以降である必要があります。
手順
Quick BI コンソール にログインします。
以下の図に示されている手順に従って、ユーザー作成の Spark SQL データソースを追加します。
データソースの作成エントリ からデータソースの作成インターフェイスに移動します。
[ユーザー作成のデータソース] タブで、[Spark SQL] データソースを選択します。

[接続の構成] ダイアログボックスで、ビジネスニーズに合わせて接続を構成します。

名前
説明
表示名
データソース構成リストに表示される名前です。
特殊文字やスペースを最初または最後に使用せずに、標準の名前を入力してください。
データベースアドレス
Spark SQL データベースがデプロイされているアドレス(IP またはドメイン名を含む)です。
ポート
データベースの対応するポート番号です。
データベース
Spark SQL データベースのデプロイ時のカスタムデータベース名です。
ユーザー名 と パスワード
Spark SQL データベースにログインするためのユーザー名とパスワードです。 ユーザー名には、データベース内のテーブルに対する作成、挿入、更新、および削除の権限があることを確認してください。
VPC データソース
VPC データソースデータベースが Alibaba Cloud VPC ネットワークを使用している場合は、 を有効にします。
データベースが Alibaba Cloud ECS にデプロイされている場合は、「インスタンス」を選択します。 クラシックロードバランサー(CLB)経由でアクセスする場合は、「CLB」を選択します。
インスタンス
購入者の Accessid:このインスタンスの購入者の AccessKey ID です。
詳細については、「AccessKey を取得する」をご参照ください。
説明AccessKey ID には、宛先インスタンスに対する読み取り権限があることを確認してください。 また、対応するセキュリティグループに対する書き込み権限がある場合は、システムによってホワイトリストが自動的に追加されます。 そうでない場合は、手動で追加する必要があります。 詳細については、「カスタムポリシーを作成する」をご参照ください。
購入者の Accesskey:このインスタンスの購入者の AccessKey Secret です。
詳細については、「AccessKey を取得する」をご参照ください。
インスタンス ID:ECS インスタンス ID です。 ECS コンソールにログインし、インスタンスタブでインスタンス ID を取得します。
詳細については、「インスタンス情報を表示する」をご参照ください。
リージョン:ECS インスタンスが配置されているリージョンです。 ECS コンソールにログインし、左上隅でリージョンを取得します。
詳細については、「インスタンス情報を表示する」をご参照ください。
CLB
購入者の Accessid:CLB 購入者の AccessKey ID です。 アカウントに CLB に対する読み取り権限があることを確認してください。 RAM コンソールにログインして AccessKey ID を取得します。
詳細については、「RAM ユーザーの AccessKey 情報を表示する」をご参照ください。
購入者の Accesskey:AccessKey ID に対応する AccessKey Secret です。 RAM コンソールにログインして AccessKey Secret を取得します。
詳細については、「RAM ユーザーの AccessKey 情報を表示する」をご参照ください。
インスタンス ID:CLB のインスタンス ID です。 サーバーロードバランサーコンソールにログインし、インスタンス管理リストでインスタンス ID を取得します。
リージョン:インスタンスが配置されているリージョンです。 サーバーロードバランサーコンソールにログインし、インスタンス管理ページの左上隅でリージョンを取得します。
SSH
[SSH] を選択した場合は、次のパラメーターを構成する必要があります。
ジャンプサーバーをデプロイし、SSH トンネル経由でデータベースにアクセスできます。 ジャンプサーバー情報は、O&M 担当者またはシステム管理者から取得します。
SSH ホスト:ジャンプサーバーの IP アドレスを入力します。
SSH ユーザー名:ジャンプサーバーにログインするためのユーザー名です。
SSH パスワード:ジャンプサーバーにログインするためのユーザー名に対応するパスワードです。
SSH ポート:ジャンプサーバーのポートです。 デフォルト値:22。
詳細については、「パスワード認証を使用して Linux インスタンスにログインする」をご参照ください。
初期化 SQL
有効にすると、データソース接続の初期化後に実行される SQL 文を構成できます。
データソース接続の初期化後に実行される SQL 文には、セミコロンで区切られた SET 文のみが許可されます。
[接続テスト] をクリックして、データソースの接続性を確認します。

テストが成功したら、[OK] をクリックして、データソースの追加を完了します。
新しく作成されたデータソースが、使用可能なデータソースの一覧に表示されるようになります。
次の手順
データソースが確立されたら、データセットの作成とデータ分析に進むことができます。
Spark SQL データベースまたはカスタム SQL からデータテーブルを Quick BI に組み込むには、「データセットを作成および管理する」をご参照ください。
可視化チャートを追加してデータを分析するには、「ダッシュボードを作成する」および「可視化チャートの概要」を参照してください。
データ分析をさらに深く掘り下げるには、「ドリル設定と表示」をご参照ください。