このトピックでは、パーティションの概念について説明します。
はじめに
パーティション化では、1 つ以上の指定されたパーティションキー列の値に基づいて、データを異なるディレクトリにグループ化することでデータを整理します。
MaxCompute では、パーティションキー列の各値がパーティションとして指定されます。複数のパーティションキー列を使用して複数レベルのパーティションを指定できます。複数レベルのパーティションは、構造的には複数レベルのディレクトリに似ています。
パーティション化は、パーティションプルーニングを有効にすることでクエリを最適化します。クエリの WHERE 句でパーティションを指定すると、MaxCompute はテーブル全体ではなく、それらのパーティションのデータのみをスキャンします。これにより、クエリのパフォーマンスが大幅に向上し、計算コストが削減されます。パーティションを適切に設計および使用することで、クエリのパフォーマンスが向上し、データ管理が簡素化され、柔軟なデータアクセスと処理がサポートされます。パーティションテーブルの詳細については、「パーティションテーブルの概要」をご参照ください。
パーティション操作
既存のテーブルのパーティションに対して、パーティションの追加やパーティション値の変更などの操作を実行できます。詳細については、「パーティションと列の操作」をご参照ください。
動的パーティションへのデータの挿入など、パーティションに対する特定の SQL 操作は効率が低下し、コストが高くなる可能性があることに注意してください。たとえば、「動的パーティションにデータを挿入または上書きする(DYNAMIC PARTITION)」をご参照ください。
パーティションテーブル
パーティションテーブルとは、1 つ以上の指定された列の値に基づいて、データが物理的に別々のストレージ場所に編成されているテーブルです。パーティションテーブルとその使用方法の詳細については、以下をご参照ください。
パーティションテーブルと非パーティションテーブルの処理に使用される特定の MaxCompute コマンドの構文は異なります。詳細については、「テーブルの作成と削除」、「テーブルの変更と表示」、および「テーブルまたは静的パーティションへのデータの挿入または更新(INSERT INTO および INSERT OVERWRITE)」をご参照ください。