Alibaba Cloud OSS (Object Storage Service)は、大量のオブジェクトを保存できる安全で信頼性の高いサービスです。

  • 標準モードのワークスペースは、 接続の分離機能をサポートしています。 開発環境と本番環境への接続を個別に追加し、接続を分離してデータを保護できます。
  • OSS の詳細については、「OSS の概要」をご参照ください。
  • SDK の詳細については、「OSS Java SDK」をご参照ください。

手順

  1. [データソース] ページで、右上に表示される [接続の追加] をクリックします。接続を追加する
  2. [接続の追加] ダイアログボックスの [半構造化ストレージ] セクションで、[OSS] をクリックします。
  3. [OSS との接続を追加] ダイアログボックスでパラメーターを設定します。OSS
    パラメーター 説明
    Connection Name VPN コネクションの名前。 名前には文字、数字、アンダースコア(_)を使用でき、先頭は文字とする必要があります。
    Description 物理接続の説明。 説明は最大で 80 文字です。
    Applicable Environment 接続が使用される環境。 設定可能な値は、 DevelopmentおよびProduction です。
    このパラメーターは、ワークスペースが標準モードの場合にのみ使用できます。
    Endpoint OSS のエンドポイント。 http://oss.aliyuncs.com 形式で指定します。 OSS のエンドポイントはリージョンによって異なります。
    ドメイン名の前にバケット名を追加した場合 (例: http://xxx.oss.aliyuncs.com )、接続テストは成功しますが、データの同期には失敗します。
    Bucket OSS バケットの名前。 バケットとは、オブジェクトを収納するためのコンテナとして機能するストレージスペースです。

    ユーザーは、1 つもしくは複数のバケットを作成するできます。また各バケットに 1 つ以上のオブジェクトを追加できます。

    データの同期中、DataWorks はここで指定されたバケット内のオブジェクトのみ検索できます。

    AccessKey ID および AccessKey Secret AccessKey ID および AccessKey Secret は、ログイン情報として使用されます。
  4. [接続のテスト] をクリックします。
  5. 接続テストの成功後、[完了] をクリックします。
OSSのデータが CSV ファイルとして保存されている場合、標準の CSV 形式である必要があります。 たとえば、CSV ファイルの列のデータに二重引用符 ( '') が含まれている場合、二重引用符を二重引用符のペア ("") で置換する必要があります。 置換されない場合、CSVファイルのデータが正しく解析されない可能性があります。

接続テストに関する注意

  • データストアがユーザーによって作成され、クラシックネットワーク上の ECS インスタンスにデプロイされている場合、接続を使用する同期ノードはカスタムリソースグループを使用して実行することを推奨します。 デフォルトのリソースグループでは、ネットワーク経由でのデータストアとの接続が保証されません。
  • データストアが VPC にデプロイされている場合、接続テストはサポートされません。 接続テストを実行しない場合でも [完了] をクリックできます。

次のステップ

OSS との接続を設定する方法は以上のとおりです。 次のチュートリアルに進むことができます。 次のチュートリアルでは、OSS リーダーおよびライターの設定方法を学習します。 詳細については、「OSS Reader」および「OSS Writer」をご参照ください。