OSSデータをMaxComputeテーブルにエクスポートコンポーネントを使用して、Object Storage Service (OSS) からMaxComputeテーブルにデータをエクスポートできます。 入力は、データファイルが保存されているOSSディレクトリです。 デフォルトでは、ディレクトリ内のすべてのデータファイルが読み取られます。 入力Object Storage Service (OSS) データファイルは、JSON Lines形式である必要があります。 ファイルの各行は有効なJSONオブジェクトですが、ファイル全体は有効なJSONオブジェクトではありません。 例を表示するには、こちらをクリックしてください。
サポートされるコンピューティングリソース
コンポーネントの設定
Platform for AI (PAI) コンソールのMachine Learning Designerのパイプラインページで、Export OSS Data to MaxCompute Tableコンポーネントのパラメーターを設定します。 下表に、各パラメーターを説明します。
タブ | パラメーター | 必須 | 説明 | デフォルト値 |
フィールドの設定 | 出力テーブル名 | 可 | 出力テーブルの名前。 | デフォルト値なし |
チューニング | マップタスクのインスタンスごとのCPU数 | 不可 | マップタスクの各インスタンスのCPU数。 有効な値: 50 ~ 800 | 100 |
マップタスクのインスタンスあたりのメモリサイズ | 不可 | マップタスクの各インスタンスのメモリサイズ。 単位:MB。 有効な値: 256〜12288。 | 1024 | |
マップの入力データの最大サイズ | 不可 | マップタスクの各インスタンスが処理できるデータの最大量。 このパラメーターを使用して、マップの入力を管理できます。 単位:MB。 有効な値: 1〜Integer.MAX_VALUE。 | 256 |