MongoDB データソースを作成することで、Dataphin が MongoDB からビジネスデータを読み取ったり、MongoDB にデータを書き込んだりできるようになります。このトピックでは、MongoDB データソースを作成する方法について説明します。
背景情報
MongoDB は、動的スキーマを持つ BSON ドキュメント(JSON に類似)を格納するオープンソースのドキュメントデータベースであり、大量の非構造化データを処理できます。その特徴には、柔軟なデータモデル、効率的なインデックスメカニズム、データレプリケーションとシャーディングのサポート、使いやすい API などがあります。 MongoDB は、迅速な反復と多様なデータ形式のストレージを必要とするアプリケーションシナリオに適しています。
MongoDB を使用する場合、MongoDB から Dataphin にビジネスデータをインポートしたり、Dataphin から MongoDB にデータをエクスポートしたりする前に、MongoDB データソースを作成する必要があります。ApsaraDB for MongoDB の詳細については、ApsaraDB for MongoDB-ApsaraDB for MongoDB とは をご参照ください。
権限
データソースの作成 権限を持つカスタムグローバルロールと、スーパー管理者、データソース管理者、ドメインアーキテクト、プロジェクト管理者 などのシステムロールのみがデータソースを作成できます。
手順
Dataphin ホームページの上部ナビゲーションバーで、[管理センター] > [データソース管理] を選択します。
[データソース] ページで、[+データソースの作成] をクリックします。
[データソースの作成] ページで、[NoSQL] セクションの [MongoDB] を選択します。
最近 MongoDB を使用したことがある場合は、[最近使用したデータソース] セクションで MongoDB を選択することもできます。また、検索ボックスに MongoDB キーワードを入力して、すばやく検索することもできます。
[MongoDB データソースの作成] ページで、接続パラメーターを構成します。
データソースの基本情報を構成します。
パラメーター
説明
データソース名
名前は次の要件を満たしている必要があります。
漢字、英字、数字、アンダースコア(_)、ハイフン(-)のみを含めることができます。
長さは 64 文字を超えることはできません。
データソースコード
データソースコードを構成した後、
data_source_code.table_nameまたはdata_source_code.schema.table_nameの形式を使用して、Flink_SQL タスクでデータソース内のテーブルを参照できます。現在の環境に基づいて対応する環境のデータソースに自動的にアクセスする必要がある場合は、変数形式${data_source_code}.tableまたは${data_source_code}.schema.tableを使用します。詳細については、「Dataphin データソーステーブル開発方法」をご参照ください。重要データソースコードは、正常に構成された後は変更できません。
データソースコードが正常に構成された後、アセットディレクトリとアセットインベントリのオブジェクト詳細ページでデータをプレビューできます。
Flink SQL では、現在、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB データソースのみがサポートされています。
バージョン
[mongodb 3.2] と [mongodb 3.4+] バージョンをサポートしています。
データソースの説明
データソースの簡単な説明。128 文字を超えることはできません。
データソース構成
構成するデータソースを選択します。
ビジネスデータソースが本番データソースと開発データソースを区別する場合、[本番 + 開発データソース] を選択します。
ビジネスデータソースが本番データソースと開発データソースを区別しない場合、[本番データソース] を選択します。
タグ
タグに基づいてデータソースを分類およびタグ付けできます。タグの作成方法については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターを構成します。
前の手順で [本番 + 開発データソース] を選択した場合、構成ページは次の図のように表示されます。[本番データソース] を選択した場合、本番データソース構成ページのみが表示されます。
説明通常、本番データソースと開発データソースは別々のデータソースとして構成し、それらの間の環境分離を実現し、開発データソースが本番データソースに与える影響を軽減する必要があります。ただし、Dataphin では、同じパラメーター値を持つ同じデータソースとして構成することもサポートされています。
パラメーター
説明
JDBC URL
マルチレプリカモードをサポートし、複数のアドレスで構成できます。接続アドレスの形式は
mongodb://host1:port1;host2:port2...です。説明JDBC URL アドレスは、authSource パラメーターの付加をサポートしています。
たとえば、ApsaraDB for MongoDB を使用すると、MongoDB コンソール のインスタンス基本情報ページで、接続アドレスとポート情報を確認できます。
ログイン方法
[ユーザー名ログイン] と [匿名ログイン] をサポートしています。
[ユーザー名]、[パスワード]
ログイン方法が [ユーザー名ログイン] の場合、MongoDB インスタンスにログインするためのユーザー名とパスワードを入力する必要があります。
[デフォルトリソースグループ] を選択します。これは、データベース SQL、オフラインデータベース移行、データプレビューなど、現在のデータソースに関連するタスクを実行するために使用されます。
[接続テスト] を実行するか、[OK] をクリックして保存し、MongoDB データソースの作成を完了します。
[接続テスト] をクリックして、データソースが Dataphin に正常に接続できるかどうかをテストします。[OK] を直接クリックすると、システムは選択したすべてのクラスターの接続を自動的にテストしますが、選択したすべてのクラスターの接続に失敗した場合でも、データソースは正常に作成されます。
[接続テスト] は、Dataphin に登録され、正常に使用されている [デフォルトクラスタ] または [登録済みスケジューリングクラスタ] の接続をテストします。[デフォルトクラスタ] はデフォルトで選択されており、選択解除できません。[登録済みスケジューリングクラスタ] にリソースグループがない場合、接続テストはサポートされていません。接続をテストする前に、まずリソースグループを作成する必要があります。
選択したクラスターは、現在のデータソースとのネットワーク接続をテストするためにのみ使用され、後で関連タスクを実行するために使用されるわけではありません。
接続テストには通常 2 分未満かかります。タイムアウトした場合は、
アイコンをクリックして具体的な理由を確認し、再試行できます。テスト結果が [接続失敗]、[接続成功]、または [警告付きで成功] のいずれであっても、システムは最終結果の生成時間を記録します。
説明[デフォルトクラスター] のテスト結果のみ、[警告付きで成功]、[接続成功]、[接続失敗] の 3 つの接続ステータスが含まれます。Dataphin の [登録済みスケジューリングクラスター] のテスト結果には、[接続成功] と [接続失敗] の 2 つの接続ステータスのみが含まれます。
テスト結果が [接続失敗] の場合、
アイコンをクリックして具体的な失敗理由を確認できます。テスト結果が [警告付きで成功] の場合、アプリケーションクラスターの接続は成功しましたが、スケジューリングクラスターの接続は失敗したことを意味します。現在のデータソースは、データ開発と統合に使用できません。
アイコンをクリックしてログ情報を表示できます。