ここでは、MaxCompute の共通概念と用語について説明します。 詳細は、ドキュメント内のリンクをご参照ください。
A
- AccessKey
Access Key (短縮形は AK。Access Key Id と Access Key Secret で構成されます) は、Alibaba Cloud API にアクセスするためのキーです。 Alibaba Cloud 公式サイトでクラウドアカウントを登録した後に、AccessKey 管理ページで作成できます。MaxCompute や他のクラウドプロダクトにアクセスする際、Accesskey によってユーザー識別と署名照合が行われます。 AccessKey Secret は機密情報として取り扱う必要があります。
- セキュリティ
MaxCompute のマルチテナント型データセキュリティシステムの主な機能は、プロジェクトスペース内のユーザー認証、ユーザー管理、権限管理、ならびにプロジェクトスペース間のリソース共有、およびプロジェクトスペース内のデータ保護です。 MaxCompute のセキュリテイ操作に関する詳細は、「セーフティガイド」をご参照ください。
C
- コンソール
MaxCompute コンソールは、Windows および Linux 環境で稼働するクライアントツールです。 コンソールを介してプロジェクトを管理したり、DDL や DML などの操作の実行コマンドを送信できます。 ツールのインストールと共通パラメーターについては、「クライアント」をご参照ください。
D
- データ型
MaxCompute テーブルのすべての列に対応したデータ型を指します。 サポート対象のデータ型については、「基本概念 > データ型」をご参照ください。
- DDL
データ定義言語。テーブルの作成やビューの作成などを実行します。MaxCompute の Div 構文については、「ユーザーガイド > DDL」をご参照ください。
- DML
データ操作言語。 データ挿入操作などを実行します。MaxCompute DML 構文については、「Insert 操作」をご参照ください。
F
- Fuxi
Fuxi は、Flying Platform の中核でリソース管理とタスクのスケジューリングを実行するモジュールです。 また、アプリケーション開発向けの基本プログラミングフレームワークも提供します。 MaxCompute のボトムタスクのスケジューリングモジュールには、Fuxi のスケジューリングモジュールが採用されています。
I
- インスタンス
ジョブの特定のインスタンスは、Hadoop ジョブの概念と同様に、実際に実行されるジョブを示します。 詳細は、「基本概念 > タスクインスタンス」をご参照ください。
M
- MapReduce
MaxCompute は、データ処理用のプログラミングモデルで、通常は大規模データセットの並列操作に使用されます。 MapReduce に実装されているインターフェイス (Java API) を使用して、MaxCompute でデータを処理するための MapReduce プログラムを作成できます。 MapReduce プログラミングの構想は、データ処理の方法を Map (マッピング) と Reduce (プロトコル) に分けることです。
正式に Map を実行する前に、分割が必要です。 スライスは入力データを同じサイズのブロックに切り分けたもので、各スライスが 1 つのマップとして機能します。 複数の Map Worker が一緒に動作できるように、Worker の入力が処理されます。各 Map Worker ごとにデータの読み取り、計算、処理が実行され、Reduce 機能によって中間結果が統合された後に、最終結果が出力されます。 詳細は、「ユーザーガイド > MapReduce」をご参照ください。
O
- ODPS
ODPS は、MaxCompute の旧名です。
P
- パーティション
パーティションは、テーブルのパーティションフィールド (1 つまたは複数の組み合わせ) をベースとして、データストアを分割します。 つまり、パーティションのないテーブルの場合、データはテーブルのあるディレクトリの直下に格納されます。 パーティションのあるテーブルの場合、各パーティションがテーブル内の 1 つのディレクトリと対応し、データはパーティションのディレクトリごとに分かれて格納されます。 パーティションの詳細は、「基本概念 > パーティション」をご参照ください。
- プロジェクト
プロジェクトは、MaxCompute の基本の組織単位です。 従来のデータベースやスキーマの概念と同様に、マルチユーザーの分離とアクセス制御の主要な境界です。 詳細は、「基本概念 > プロジェクト」をご参照ください。
R
- ロール
ロールは、MaxCompute のセキュリティ機能で使用される概念であり、同じ権限を持つユーザーの集合体をいいます。 同時に 1 つのロールに複数のユーザーを割り当てることができます。また、1 人のユーザーが複数のロールに属することもできます。 すべてのロールの権限付与が完了すると、同じロールが割り当てられたすべてのユーザーは、同じ権限を持ちます。 ロール管理の詳細は、「ユーザーガイド > ロール管理」をご参照ください。
- リソース
リソースは、MaxCompute 特有の概念です。 MaxCompute のカスタム関数 (UDF) や MapReduce 関数を使用する場合は、関数を完成させるためのリソースが必要です。 詳細は、「基本概念 > リソース」をご参照ください。
S
- SDK
ソフトウェア開発キット。 一般的に、ソフトウェアエンジニアが特定のソフトウェアパッケージ、ソフトウェアインスタンス、ソフトウェアフレームワーク、ハードウェアプラットフォーム、オペレーティングシステム、ドキュメントパッケージなどに対応したアプリケーションソフトウェアを構築するために使用する一連の開発ツールを指します。 現在、MaxCompute では、Java SDK と Python SDK を使用できます。
- 権限付与
プロジェクトスペースの管理者またはプロジェクトオーナーは、MaxCompute のオブジェクト (タスクやリソースなど) で特定の操作 (読み取り、書き込み、表示など) を実行する権限をユーザーに付与します。 権限付与の操作については、「ユーザー管理」をご参照ください。
- サンドボックス
セキュリティ機能の制限事項: MaxCompute MapReduce および UDF プログラムを分散環境で実行する場合、Java サンドボックスにより制限されます。
T
- テーブル
テーブルは、MaxCompute のデータストレージ単位です。 詳細は、「基本概念 > テーブル」をご参照ください。
- Tunnel
MaxCompute のデータチャネルは、並列性の高いオフラインのデータアップロードとダウンロードサービスを提供します。 Tunnel サービスを使用すると、MaxCompute への一括アップロードやダウンロードを実行できます。 関連コマンドについては、「Tunnel コマンド操作」または「一括データチャネル SDK」をご参照ください。
U
- UDF
汎用 UDF (ユーザー定義関数) です。MaxCompute に実装されている Java プログラミングインターフェイスを使用して、カスタム関数を開発できます。詳細は、「ユーザーガイド > UDF」をご参照ください。
狭い意味で、UDF は入力と出力が 1 対 1 の関係にあるユーザー定義スカラー関数のことを指します。つまり、データが 1 行読み取られると、出力値が 1 つ書き出されます。
- UDAF
ユーザー定義集計関数。入力と出力が多対 1 の関係にあるカスタム集計関数です。複数の入力レコードを集計して、1 つの値が出力されます。 SQL では Group By 文と組み合わせて使用することもできます。 詳細は、「Java UDF > UDAF」をご参照ください。
- UDTF
User Defined Table Valued Function。詳細は「Java UDF>UDAF」をご参照ください。