MaxFrame APIは、互換性APIとMaxFrame固有のAPIに分類されます。 互換性APIは、Pandasなどのさまざまな標準ライブラリと統合して、データ処理を容易にします。 タスクを分散実行するために、MaxFrame固有のAPIが導入されました。 MaxFrame APIを使用してジョブを開発すると、標準データベースと同様のデータ操作エクスペリエンスが得られ、MaxFrameプラットフォームで大規模なデータ処理タスクを効率的に実行できます。
MaxFrame固有のAPI
APIタイプ | API名 | 説明 |
タスクセッション | MaxFrameジョブセッションを開始します。 new_sessionメソッドは、タスク全体の実行を初期化するためにスクリプトの最初に呼び出されます。 その後のデータ処理は、初期化中に構築されたセッションオブジェクトとバックエンドサービスとの間の対話に基づいて実行される。 | |
入力 /出力 | MaxComputeテーブル全体、テーブルの特定のパーティション、またはテーブルの特定の列のデータに基づいてDataFrameオブジェクトを構築します。 | |
MaxCompute SQL文のクエリ結果に基づいてDataFrameオブジェクトを構築します。 | ||
DataFrameデータをMaxComputeテーブルに書き込みます。 | ||
タスク実行 | タスクを実行します。 MaxFrameは遅延コンピューティングモデルを使用します。 タスクの実行は、executeメソッドが呼び出されたときにのみトリガーされます。 このAPIにより、データ変換をパイプラインの最後まで遅らせることができます。 このようにして、1つのタスクで複数の操作を同時に実行できます。 これにより、クライアントとデータベース間で送信されるデータ量が削減され、パフォーマンスが向上します。 | |
タスク結果の取得 | タスクの計算結果を取得します。 計算結果はクライアントに直接送信されません。 これにより、送信されるデータ量やクライアントの負荷を軽減することができる。 結果データの一部をチェックするには、executeメソッドの後にfetchメソッドを呼び出して結果データを取得します。 |
MaxFrame for Pandas
DataFrame
APIタイプ
関連ドキュメント
コンストラクター
Attributes
数学的計算
フィルタリング、投影、サンプリング
ソート
結合、結合、およびマージ
ユーザー定義関数 (UDF) 、集計、およびウィンドウ
変換
シリーズ
APIタイプ
関連ドキュメント
コンストラクター
数学的計算
フィルタリング、投影、サンプリング
ソート
UDF、アグリゲート、およびウィンドウ
Index
APIタイプ
関連ドキュメント
コンストラクター
フィルタリング、投影、サンプリング
変換
MaxFrameでサポートされているPandas API
DataFrame
シリーズ
インデックス
すべてのパラメーターをサポートするAPI: drop_duplicates
特定のパラメータをサポートするAPI:
astype: astype('category') をサポートしていません。