PyODPS は pandas のような API、PyODPS DataFrame を提供しており、MaxCompute の計算能力を最大限に活用できます。 また、データソースを MaxCompute テーブルから pandas DataFrame に変更して、同じコードを pandas 上で実行することもできます。
PyODPS DataFrame のメンテナンスは終了しました。新規プロジェクトでは、この機能を使用しないでください。
はじめに: DataFrame オブジェクトの作成および管理方法と、DataFrame を使用したデータ処理方法について説明します。
DataFrame オブジェクトの作成: データソースを参照する DataFrame プロジェクトの作成方法について説明します。
シーケンス: DataFrame のシーケンスオブジェクトについて紹介します。SequenceExpr は、2 次元データセットの列を表します。 SequenceExpr オブジェクトを手動で作成することはできません。 コレクションオブジェクトから取得することのみ可能です。
コレクション: DataFrame のコレクションオブジェクトについて紹介します。 CollectionExpr は、列操作、データフィルタリング、データ変換など、2 次元データセットに対するさまざまな操作をサポートしています。
実行: DataFrame で操作を実行するために呼び出すことができる実行メソッドについて紹介します。
MapReduce API: DataFrame で MapReduce API を使用する方法について説明します。
列操作: DataFrame でサポートされている列操作について説明します。
集約: DataFrame でサポートされている集約操作について説明します。 また、グループ集約を実装し、集約関数を記述する方法についても説明します。
データのソート、重複排除、サンプリング、および変換: DataFrame オブジェクトでソート、重複排除、サンプリング、およびデータ変換を実行する方法について説明します。
データのマージ: DataFrame でサポートされているデータマージ操作について説明します。 これらの操作には、JOIN 操作と UNION 操作が含まれます。
ウィンドウ関数: DataFrame でサポートされているウィンドウ関数について説明します。
プロット: DataFrame によって提供されるプロットメソッドについて説明します。
デバッグ: DataFrame のデバッグを実行する方法について説明します。 DataFrame は実行全体を最適化して表示できます。 実行を視覚化できます。