このトピックでは、MaxComputeで使用される用語と概念について説明します。 これは、MaxComputeを使用する前に、MaxComputeをよりよく理解するのに役立ちます。
A
アクセスキー(AccessKey)
AccessKeyペアは、Alibaba Cloud APIにアクセスするための資格情報です。 AccessKey ペアは、AccessKey ID と AccessKey secret で構成されます。 国際サイト (alibabacloud.com) でAlibaba Cloudアカウントを作成すると、AccessKey管理ページでAccessKeyペアが生成されます。 AccessKeyペアは、ユーザーを識別し、MaxComputeや他のAlibaba Cloudサービスへのアクセス、またはサードパーティのツールへの接続のリクエストの署名を検証するために使用されます。 認証情報の漏洩を防ぐため、AccessKeyを秘密にしてください。 AccessKey secretが誤って漏洩した場合は、直ちにAccessKey secretを無効化または更新してください。
セキュリティ
MaxComputeマルチテナントデータセキュリティシステムは、ユーザー認証、ユーザーと権限の管理、プロジェクト間のリソース共有、プロジェクトデータ保護などの機能を提供します。 MaxComputeのセキュリティ管理操作の詳細については、「権限の概要」をご参照ください。
C
コンソール
WindowsまたはLinuxで実行されるMaxComputeクライアント。 MaxComputeクライアントでは、プロジェクト管理操作、データ記述言語 (DDL) 操作、データ操作言語 (DML) 操作などの操作を実行するためのコマンドを実行できます。 MaxComputeクライアントの使用方法の詳細については、「MaxComputeクライアント (odpscmd) 」をご参照ください。
D
データ型
MaxComputeテーブルの列のデータの種類。 MaxComputeデータ型のエディションと各エディションでサポートされているデータ型の詳細については、「データ型のエディション」をご参照ください。
DDL
テーブルやビューの作成などのDDL操作。 DDL構文の詳細については、「DDLステートメント」をご参照ください。
DML
INSERT、UPDATE、DELETE操作などのDML操作。 DML構文の詳細については、「DMLステートメント」をご参照ください。
F
関数
MaxComputeが提供する関数には、組み込み関数とユーザー定義関数 (UDF) が含まれます。 関数の詳細については、「関数」をご参照ください。
ジョブスケジューラ
ジョブスケジューラは、Apsara分散オペレーティングシステムのカーネル内のモジュールです。 ジョブスケジューラは、リソースを管理し、ジョブをスケジュールするために使用されます。 ジョブスケジューラは、アプリケーション開発のための基本的なプログラミングフレームワークも提供します。 ジョブスケジューラは、MaxComputeの基盤となるタスクスケジューリングモジュールとして機能します。
I
インスタンス
インスタンスは実行中のジョブで、Hadoopのジョブに似ています。 詳細は、「タスクインスタンス」をご参照ください。
M
MapReduce
MapReduceは、データ処理のプログラミングモデルです。 MapReduceは、大きなデータセットの並列操作に使用されます。 MapReduceが提供するJava APIを使用して、MapReduceプログラムを作成し、MaxComputeデータを処理できます。 MapReduceの考え方は、データ処理方法をMapとReduceとして分類することです。 データのマッピングにはMapメソッドが使用され、データの組み合わせにはReduceメソッドが使用されます。
Map操作を実行する前に、入力データが同じサイズのデータブロックにスライスされていることを確認してください。 各データブロックは、単一のMapワーカーノードへの入力として処理される。 このようにして、複数のMapワーカーノードを同時に動作させることができます。 各Mapワーカーノードは、入力データブロックを処理し、Reduceワーカーノードへの中間結果を生成する。 次に、Reduceワーカーノードは、複数のMapワーカーノードの出力を組み合わせて最終結果を取得します。 詳細は、「MapReduce」をご参照ください。
N
ネットワーク接続
外部テーブル、UDF、またはレイクハウスソリューションを使用する前に、仮想プライベートクラウド (VPC) またはインターネット経由でMaxComputeと他のサービス間にネットワーク接続を確立する必要があります。 これにより、MaxComputeは、VPC内またはインターネット経由でHBase、RDS、Hadoopなどのサービスにアクセスできます。 ネットワーク接続の詳細については、「ネットワーク接続プロセス」をご参照ください。
P
パーティション
パーティションは、パーティションキーに基づくテーブルの分割であり、1つ以上のパーティションキー列で構成されます。 パーティションは、テーブルに格納されたデータを分割するために使用されます。 テーブルがパーティション分割されていない場合、テーブル内のデータはテーブルを格納するディレクトリに格納されます。 テーブルがパーティション分割されている場合、各パーティションはテーブルを格納するディレクトリ内のサブディレクトリにマップされます。 この場合、データは別々のサブディレクトリに格納されます。 パーティションの詳細については、「パーティション」をご参照ください。
プロジェクト
プロジェクトは、MaxComputeの基本的な組織単位です。 従来のデータベースシステムのデータベースまたはスキーマと同様に、プロジェクトを使用してユーザーを分離し、アクセス要求を制御します。 プロジェクトの詳細については、「プロジェクト」をご参照ください。
Q
クォータ
クォータは、MaxComputeのコンピューティングリソースプールとして機能します。 クォータは、ジョブの実行に必要なコンピューティングリソースを提供します。 クォータの詳細については、「クォータ」をご参照ください。
R
ロール
ロールは、MaxComputeセキュリティ機能の概念です。 ロールは、同じ権限を持つユーザーのセットと見なすことができます。 1人のユーザーが複数の役割を引き受け、複数のユーザーが同じ役割を引き受けることができます。 ロールに権限を付与すると、このロールに割り当てられたすべてのユーザーに同じ権限が付与されます。 ロールの管理方法の詳細については、「ロールの計画」をご参照ください。
リソース
リソースはMaxComputeの特別な概念です。 MaxComputeでUDFおよびMapReduce操作を実装するために必要なリソースが必要です。 リソースの詳細については、「リソース」をご参照ください。
S
SDK
ソフトウェア開発キット (SDK) は、ソフトウェアエンジニアが特定のソフトウェアパッケージ、ソフトウェアインスタンス、ソフトウェアフレームワーク、ハードウェアプラットフォーム、オペレーティングシステム、またはドキュメントパッケージ用のアプリケーションソフトウェアを構築するために使用する開発ツールのコレクションです。 MaxComputeは、SDK for JavaとSDK for Pythonをサポートしています。
承認
権限付与により、プロジェクト管理者またはプロジェクト所有者は、MaxComputeオブジェクトに対する権限を他のユーザーに付与できます。 承認後、これらのユーザーはMaxComputeオブジェクトに対して特定の操作を実行できます。 たとえば、これらのユーザーは、テーブル、タスク、リソースなどのオブジェクトを読み取り、書き込み、および表示できます。 権限付与の詳細については、「ユーザーの計画と管理」をご参照ください。
サンドボックス
サンドボックスは、セキュリティポリシーに基づいてプログラムアクションを制限する分離環境です。 サンドボックスは、別の環境でJavaコードの実行を分離し、悪意のあるコードがローカルシステムリソースにアクセスするのを制限するセキュリティメカニズムとして機能します。 これにより、ローカルシステムの損傷を防ぎます。 分散環境で実行されるMaxCompute MapReduceおよびUDFは、Javaサンドボックスによって制限されます。
T
テーブル
MaxComputeでは、テーブルを使用してデータを保存します。 テーブルの詳細については、「テーブル」をご参照ください。
Tunnel
TunnelはMaxComputeのデータチャネルです。 Tunnelは、同時並行性の高いオフラインデータのアップロードとダウンロードを提供します。 MaxCompute Tunnelを使用して、バッチでMaxComputeにデータをアップロードしたり、オンプレミスマシンにデータをバッチでダウンロードしたりできます。 関連コマンドの詳細については、「Tunnelコマンド」または「MaxCompute Tunnel SDK」をご参照ください。
U
UDF
広い意味では、ユーザー定義関数 (UDF) には、ユーザー定義スカラー関数、ユーザー定義集計関数 (UDAF) 、およびユーザー定義テーブル値関数 (UDTF) が含まれます。 MaxComputeでは、JavaまたはPythonでUDFを開発できます。 詳細は、「MaxCompute UDF」をご参照ください。
狭い意味では、UDFはユーザー定義のスカラー関数のみを指します。 UDFの入力データと出力データには1対1のマッピング関係があります。これは、UDFが1行のデータを読み取るたびに1つの値が返されることを示します。
UDAF
UDAFの入力および出力データは、多対1のマッピング関係を有する。 複数の入力レコードを集約して1つの出力値を生成する。 UDAFは、SQL文のGROUP BY句とともに使用できます。 UDAFの詳細については、「UDAF」をご参照ください。
UDTF
UDTFのみが複数のフィールドを返すことができます。 UDTFの詳細については、「UDTF」をご参照ください。
ユーザー
ユーザーは、MaxComputeセキュリティ機能の概念です。 Alibaba Cloudアカウント、RAMユーザー、またはRAMロールが割り当てられているユーザーを使用して、MaxComputeにアクセスできます。 プロジェクト所有者を除くすべてのユーザーをMaxComputeプロジェクトに追加し、MaxComputeでデータ、ジョブ、リソース、および関数を管理するための関連する権限を付与する必要があります。 ユーザーを管理する方法の詳細については、「ユーザーの計画と管理」をご参照ください。
V
ビュー
ビューは、既存のテーブルに基づいて作成される仮想テーブルです。 そのスキーマとコンテンツは、これらのテーブルから派生します。 ビューは、1つ以上のテーブルに対応する。 追加のテーブルを作成せずにクエリ結果を保持する場合は、ビューを使用できます。 ビューの詳細については、「ビュー関連の操作」をご参照ください。