ここでは、MaxCompute の共通概念と用語について説明します。 詳細は、ドキュメント内のリンクをご参照ください。

A

  • AccessKey

    Access Key (短縮形は AK。Access Key Id と Access Key Secret で構成されます) は、Alibaba Cloud API にアクセスするためのキーです。 Alibaba Cloud 公式サイトでクラウドアカウントを登録した後に、AccessKey 管理ページで作成できます。MaxCompute や他のクラウドプロダクトにアクセスする際、Accesskey によってユーザー識別と署名照合が行われます。 AccessKey Secret は機密情報として取り扱う必要があります。

  • セキュリティ

    MaxCompute のマルチテナント型データセキュリティシステムの主な機能は、プロジェクトスペース内のユーザー認証、ユーザー管理、権限管理、ならびにプロジェクトスペース間のリソース共有、およびプロジェクトスペース内のデータ保護です。 MaxCompute のセキュリテイ操作に関する詳細は、「セーフティガイド」をご参照ください。

C

  • コンソール

    MaxCompute コンソールは、Windows および Linux 環境で稼働するクライアントツールです。 コンソールを介してプロジェクトを管理したり、DDL や DML などの操作の実行コマンドを送信できます。 ツールのインストールと共通パラメーターについては、「クライアント」をご参照ください。

D

  • データ型

    MaxCompute テーブルのすべての列に対応したデータ型を指します。 サポート対象のデータ型については、「基本概念 > データ型」をご参照ください。

  • DDL

    データ定義言語。テーブルの作成やビューの作成などを実行します。MaxCompute の Div 構文については、「ユーザーガイド > DDL」をご参照ください。

  • DML

    データ操作言語。 データ挿入操作などを実行します。MaxCompute DML 構文については、「Insert 操作」をご参照ください。

F

  • Fuxi

    Fuxi は、Flying Platform の中核でリソース管理とタスクのスケジューリングを実行するモジュールです。 また、アプリケーション開発向けの基本プログラミングフレームワークも提供します。 MaxCompute のボトムタスクのスケジューリングモジュールには、Fuxi のスケジューリングモジュールが採用されています。

I

  • インスタンス

    ジョブの特定のインスタンスは、Hadoop ジョブの概念と同様に、実際に実行されるジョブを示します。 詳細は、「基本概念 > タスクインスタンス」をご参照ください。

M

  • MapReduce

    MaxCompute は、データ処理用のプログラミングモデルで、通常は大規模データセットの並列操作に使用されます。 MapReduce に実装されているインターフェイス (Java API) を使用して、MaxCompute でデータを処理するための MapReduce プログラムを作成できます。 MapReduce プログラミングの構想は、データ処理の方法を Map (マッピング) と Reduce (プロトコル) に分けることです。

    正式に Map を実行する前に、分割が必要です。 スライスは入力データを同じサイズのブロックに切り分けたもので、各スライスが 1 つのマップとして機能します。 複数の Map Worker が一緒に動作できるように、Worker の入力が処理されます。各 Map Worker ごとにデータの読み取り、計算、処理が実行され、Reduce 機能によって中間結果が統合された後に、最終結果が出力されます。 詳細は、「ユーザーガイド > MapReduce」をご参照ください。

O

  • ODPS

    ODPS は、MaxCompute の旧名です。

P

  • パーティション

    パーティションは、テーブルのパーティションフィールド (1 つまたは複数の組み合わせ) をベースとして、データストアを分割します。 つまり、パーティションのないテーブルの場合、データはテーブルのあるディレクトリの直下に格納されます。 パーティションのあるテーブルの場合、各パーティションがテーブル内の 1 つのディレクトリと対応し、データはパーティションのディレクトリごとに分かれて格納されます。 パーティションの詳細は、「基本概念 > パーティション」をご参照ください。

  • プロジェクト

    プロジェクトは、MaxCompute の基本の組織単位です。 従来のデータベースやスキーマの概念と同様に、マルチユーザーの分離とアクセス制御の主要な境界です。 詳細は、「基本概念 > プロジェクト」をご参照ください。

R

  • ロール

    ロールは、MaxCompute のセキュリティ機能で使用される概念であり、同じ権限を持つユーザーの集合体をいいます。 同時に 1 つのロールに複数のユーザーを割り当てることができます。また、1 人のユーザーが複数のロールに属することもできます。 すべてのロールの権限付与が完了すると、同じロールが割り当てられたすべてのユーザーは、同じ権限を持ちます。 ロール管理の詳細は、「ユーザーガイド > ロール管理」をご参照ください。

  • リソース

    リソースは、MaxCompute 特有の概念です。 MaxCompute のカスタム関数 (UDF) や MapReduce 関数を使用する場合は、関数を完成させるためのリソースが必要です。 詳細は、「基本概念 > リソース」をご参照ください。

S

  • SDK

    ソフトウェア開発キット。 一般的に、ソフトウェアエンジニアが特定のソフトウェアパッケージ、ソフトウェアインスタンス、ソフトウェアフレームワーク、ハードウェアプラットフォーム、オペレーティングシステム、ドキュメントパッケージなどに対応したアプリケーションソフトウェアを構築するために使用する一連の開発ツールを指します。 現在、MaxCompute では、Java SDK と Python SDK を使用できます。

  • 権限付与

    プロジェクトスペースの管理者またはプロジェクトオーナーは、MaxCompute のオブジェクト (タスクやリソースなど) で特定の操作 (読み取り、書き込み、表示など) を実行する権限をユーザーに付与します。 権限付与の操作については、「ユーザー管理」をご参照ください。

  • サンドボックス

    セキュリティ機能の制限事項: MaxCompute MapReduce および UDF プログラムを分散環境で実行する場合、Java サンドボックスにより制限されます。

T

  • テーブル

    テーブルは、MaxCompute のデータストレージ単位です。 詳細は、「基本概念 > テーブル」をご参照ください。

  • Tunnel

    MaxCompute のデータチャネルは、並列性の高いオフラインのデータアップロードとダウンロードサービスを提供します。 Tunnel サービスを使用すると、MaxCompute への一括アップロードやダウンロードを実行できます。 関連コマンドについては、「Tunnel コマンド操作」または「一括データチャネル SDK」をご参照ください。

U

  • UDF

    汎用 UDF (ユーザー定義関数) です。MaxCompute に実装されている Java プログラミングインターフェイスを使用して、カスタム関数を開発できます。詳細は、「ユーザーガイド > UDF」をご参照ください。

    狭い意味で、UDF は入力と出力が 1 対 1 の関係にあるユーザー定義スカラー関数のことを指します。つまり、データが 1 行読み取られると、出力値が 1 つ書き出されます。

  • UDAF

    ユーザー定義集計関数。入力と出力が多対 1 の関係にあるカスタム集計関数です。複数の入力レコードを集計して、1 つの値が出力されます。 SQL では Group By 文と組み合わせて使用することもできます。 詳細は、「Java UDF > UDAF」をご参照ください。

  • UDTF

    User Defined Table Valued Function。詳細は「Java UDF>UDAF」をご参照ください。