odpscmd クライアントを使用することで、MaxCompute のプロジェクトと各機能にアクセスすることができます。 このトピックでは、クライアントをインストール、設定、および実行する方法について説明します。

始める前に

  • odpscmd クライアントは、Java 言語に基づいて開発されています。 odpscmd クライアントをインストールする前に、Java 8 以降がコンピューターにインストールされていることを確認します。
  • odpscmd クライアントを設定する前に、プロジェクトの作成がされていることを確認します。 詳細については、「プロジェクトの作成」をご参照ください。

手順

odpscmd クライアントをインストールする
  1. Github で対象のバージョンの odpscmd クライアントのインストールパッケージをダウンロードします。
  2. インストールパッケージを解凍して、binconflib、および plugins フォルダーを作成します。
クライアント設定ファイルを設定する
  1. conf フォルダーの odps_config.ini ファイルを編集して、クライアントを設定します。 例として、以下のような設定を取り上げます。
    # Specify the name of the project you want to access.
    project_name=my_project
    # Specify the AccessKey ID and AccessKey secret of your Alibaba Cloud account. To obtain the AccessKey ID and AccessKey secret, log on to the Alibaba Cloud console and go to the AccessKey page. Remove the angle brackets (< >) when entering the AccessKey ID and AccessKey secret.
    access_id=*******************
    access_key=********************* 
    # Specify the endpoint of MaxCompute.
    end_point=https://service.odps.aliyun.com/api 
    # Specify the Logview address that the client returns after a job is run. After accessing the address, you can view detailed operational logs of the job.
    log_view_host=http://logview.odps.aliyun.com 
    # Specify whether to enable HTTPS access.
    https_check=true 
    
    # Specify the maximum size of input data, in GB.
    data_size_confirm=100.0
    # Specify the URL for upgrading of the odpscmd client.
    update_url=http://repo.aliyun.com/odpscmd
    # Specify whether to download SQL running results by instance tunnel.
    use_instance_tunnel=true
    # Specify the maximum number of records in the SQL running results downloaded by instance tunnel.
    instance_tunnel_max_record=10000
    # Specify the endpoint of the tunnel service.  
    tunnel_endpoint=https://dt.odps.aliyun.com # MaxCompute
    • プロジェクトの作成時に選択したリージョンに基づいて、end_point および tunnel_endpoint を設定することを推奨しています。 正しく設定されていない場合、アクセス障害などのエラーがスローされる場合があります。 詳細については、「エンドポイントの設定」をご参照ください。
    • MaxCompute プロジェクトが DataWorks コンソールで標準モードで作成されている場合、project_name を指定するときは、運用環境と開発環境のプロジェクトの名前の違いにご注意ください。 開発環境のプロジェクトの名前は、_dev サフィックスで終わります。 詳細については、「簡易モードと標準モード」をご参照ください。
    • odps_config.ini ファイルの行をコメントアウトするには、番号記号 (#) を使用します。 odpscmd クライアントのコマンド行をコメント化するには、2 つの連続したマイナス記号 (--) を使用します。
    • MaxCompute では、パブリックネットワークエンドポイント、クラシックネットワークエンドポイント、VPC エンドポイントの 3 種類のエンドポイントが利用できます。 ダウンロードコストはユーザーのエンドポイントに左右されます。 トンネルエンドポイントを設定していない場合、トンネルは自動的にインターネットにルーティングされ、ダウンロードコストが発生する可能性があります。
odpscmd クライアントを実行する
  1. Linux では ./bin/odpscmdを、Windows では ./bin/odpscmd.bat を実行します。 次のインターフェイスが表示される場合、odpscmd クライアントは正常に実行されています。

次のタスク

odpscmd クライアントの使用方法については、「クライアント」をご参照ください。
  • ビッグデータの処理には、MaxCompute Studioの使用を推奨しています。 MaxCompute Studio は Java と統合され、MaxCompute SQL スクリプトの開発と実行、データの管理、視覚化された方法でのログの分析、UDFMapRedure プログラムなどの Java コードの開発を可能にします。 現在は、odpscmd クライアントも MaxCompute Studio に統合されています。
  • また、 MaxCompute はDataWorks からも使用できます。 DataWorks コンソールでワークスペースを作成し、[ワークスペース] ページの [操作] 列に表示される [データ分析] をクリックします。
  • DataWorks を使用してユーザーを追加し、権限を付与する方法の詳細については、「ユーザーの追加とロールの設定」をご参照ください。