本トピックでは、さまざまなバージョンの Spark クライアントに共通するパラメーター構成について説明します。
MaxCompute アカウントのパラメーター構成
パラメーター | 説明 |
| MaxCompute プロジェクト名です。 DataWorks を通じてジョブを送信する場合、デフォルト値を使用するため、構成は不要です。 |
| ターゲットの MaxCompute プロジェクトへのアクセス権限を持つ AccessKey ID です。AccessKey ID は AccessKey 管理ページで取得できます。 DataWorks を通じてジョブを送信する場合、デフォルト値を使用するため、構成は不要です。 |
| AccessKey ID に対応する AccessKey Secret です。 DataWorks を通じてジョブを送信する場合、デフォルト値を使用するため、構成は不要です。 |
| MaxCompute プロジェクトの STS トークンです。 DataWorks を通じてジョブを送信する場合、デフォルト値を使用するため、構成は不要です。 |
|
|
| MaxCompute が所在するリージョンのクラウド製品相互接続エンドポイントです。 例えば、中国 (杭州) リージョンのサービス相互接続エンドポイントは |
MaxCompute Spark のジョブ送信、バージョン、ログの構成
パラメーター | 説明 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Spark のリソース割り当て構成
パラメーター | 説明 |
| デフォルト値:1。Spark アプリケーションがクラスター内で起動するエグゼキュータプロセスの総数です。 |
| デフォルト値:1。各エグゼキュータプロセスで利用可能な CPU コアの数です。 |
| デフォルト値:2 g。エグゼキュータプロセスあたりの総メモリで、ヒープメモリとオフヒープメモリを含みます。 |
| デフォルト値:1。ドライバープロセスが使用する CPU コアの数です。 |
| デフォルト値:2 g。ドライバープロセスの総メモリです。 |
|
|
|
|
|
|
MaxCompute の読み取り/書き込み構成
spark.sql.catalog.odps で始まる以下の構成は、Spark 3.x バージョンにのみ適用されます。
パラメーター | 説明 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MaxCompute のデータ相互運用性構成
spark.hadoop.odps.cupid.resources
このパラメーターは spark-defaults.conf ファイルまたは DataWorks の設定項目で構成する必要があります。このパラメーターをコード内で構成しないでください。
説明:
ジョブの実行に必要なMaxCompute リソースを指定します。フォーマットは
<projectname>.<resourcename>です。複数のリソースを指定するには、カンマで区切ります。指定されたリソースは、ドライバーとエグゼキュータの現在の作業ディレクトリ (
/workdir) にダウンロードされます。ダウンロード完了後、デフォルトのファイル名は<projectname>.<resourcename>となります。圧縮されたリソースは自動的に展開されます。最上位ディレクトリの名前は、元のアーカイブの名前と一致します。例えば、リソース名がexamples.tar.gzで名前が変更されていない場合、その内容は/workdir/examples.tar.gz/sub/...パスに展開されます。リソース名をexamplesに変更すると、その内容は/workdir/examples/sub/...パスに展開されます。正確なパスは、アーカイブの名前とその内部ディレクトリ構造によって異なります。例:
spark.hadoop.odps.cupid.resources = public.python-python-2.7-ucs4.zip,public.myjar.jar。リソースの名前変更:構成中にリソースの名前を変更するには、
<projectname>.<resourcename>:<newresourcename>のフォーマットを使用します。名前変更の例:
spark.hadoop.odps.cupid.resources = public.myjar.jar:myjar.jar。
その他の MaxCompute 構成
パラメーター | 説明 |
| VPC 設定を構成します。詳細については、Alibaba Cloud VPC へのアクセスをご参照ください。 |
| デフォルト値なし。ご利用の Spark クラスターがネットワーク経由で Alibaba Cloud サービスのイントラネット相互通信サイトにアクセスできない場合は、このパラメーターを構成します。Alibaba Cloud OSS へのアクセスをご参照ください。 |
|
|
|
|
|
|
|
|
|
|