このトピックでは、PyODPSが提供する設定オプションについて説明します。
odps.optionsを使用して、PyODPSが提供する設定オプションを取得できます。
from odps import options
# Set the lifecycle option to specify the lifecycle of all output tables.
options.lifecycle = 30
# Set the tunnel.string_as_binary option to True to use bytes instead of Unicode to download data of the STRING type.
options.tunnel.string_as_binary = True
# When you execute PyODPS DataFrames in MaxCompute, you can refer to the following configuration to set the limit to a relatively large value during a sort operation.
options.df.odps.sort.limit = 100000000一般設定
オプション | 説明 | デフォルト値 |
end_point | MaxComputeのエンドポイント。 | なし |
default_project | デフォルトのプロジェクト。 | なし |
log_view_host | Logviewのホスト名。 | なし |
log_view_hours | Logviewの保持時間。 単位:時間。 | 24 |
local_timezone | 使用されるタイムゾーン。 True は現地時間、False は UTC を示します。 | なし |
lifecycle | すべてのテーブルのライフサイクル。 | なし |
temp_lifecycle | 一時テーブルのライフサイクル。 | 1 |
biz_id | ユーザー ID。 | なし |
verbose | ログを表示するかどうかを指定します。 | False |
verbose_log | ログ受信者。 | なし |
chunk_size | 書き込みバッファーのサイズ。 | 1496 |
retry_times | リクエストの再試行回数。 | 4 |
pool_connections | 接続プール内のキャッシュされた接続の数。 | 10 |
pool_maxsize | 接続プールの最大容量。 | 10 |
connect_timeout | 接続タイムアウト期間。 | 5 |
read_timeout | 読み取りタイムアウト期間。 | 120 |
api_proxy | APIプロキシサーバー。 | なし |
data_proxy | データプロキシサーバー。 | なし |
completion_size | オブジェクト補完リストアイテムの数の制限。 | 10 |
notebook_repr_widget | インタラクティブグラフを使用するかどうかを指定します。 | 正しい |
sql.settings | MaxCompute SQLのグローバルヒント。 | なし |
sql.use_odps2_extension | MaxCompute 2.0言語拡張を有効にするかどうかを指定します。 | False |
データのアップロードとダウンロードの設定
オプション | 説明 | デフォルト値 |
tunnel.endpoint | MaxCompute Tunnelのエンドポイント。 | なし |
tunnel.use_instance_tunnel | InstanceTunnelを使用して実行結果を取得するかどうかを指定します。 | 正しい |
tunnel.limit_instance_tunnel | InstanceTunnelを使用して取得するデータレコードの数を制限するかどうかを指定します。 | なし |
tunnel.string_as_binary | STRING型のデータにUnicodeの代わりにバイトを使用するかどうかを指定します。 | False |
DataFrameの設定
オプション | 説明 | デフォルト値 |
interactive | DataFramesをインタラクティブ環境で使用するかどうかを指定します。 | 検出値に依存します。 |
df.analyze | MaxComputeにビルドされていない関数を有効にするかどうかを指定します。 | 正しい |
df.optimize | 完全なDataFrame最適化を有効にするかどうかを指定します。 | 正しい |
df.optimizes.pp | DataFrame述語のプッシュダウン最適化を有効にするかどうかを指定します。 | 正しい |
df.optimizes.cp | DataFrame列の剪定最適化を有効にするかどうかを指定します。 | 正しい |
df.optimizes.tunnel | DataFrameトンネル最適化を有効にするかどうかを指定します。 | 正しい |
df.quote | MaxCompute SQLのバックエンドでフィールド名とテーブル名をマークするために、1組の重大なアクセント ( | 正しい |
df.libraries | DataFrame操作に使用されるサードパーティライブラリのリソース名。 | なし |
df.supersede_libraries | 自己アップロードされたNumPyを使用してサービスのバージョンを置き換えるかどうかを指定します。 | False |
df.odps.sort.limit | DataFramesの並べ替え操作中に追加されるアイテムの数の既定の制限。 | 10000 |
機械学習の設定
オプション | 説明 | デフォルト値 |
ml.xflow_settings | XFlowの実行設定。 | なし |
ml.xflow_project | デフォルトのXFlowプロジェクト名。 | algo_public |
ml.use_model_transfer | ModelTransferを使用してモデルのPMML (Predictive Model Markup Language) ファイルを取得するかどうかを指定します。 | False |
ml.model_volume | ModelTransferで使用されるボリュームの名前。 | pyodps_volume |