このトピックでは、ロールに基づいた推奨事項を示します。
MaxCompute初心者
MaxComputeの初心者の方は、まず次の表に記載されているモジュールに慣れることをお勧めします。
モジュール | 説明 |
MaxComputeの概要を説明し、MaxComputeの機能、シナリオ、制限、および基本概念について説明します。 このモジュールは、MaxComputeの一般的な知識を得るのに役立ちます。 | |
アカウントの作成、環境の準備、テーブルの作成、データのインポート、SQLジョブの実行、および返されたデータのエクスポート方法について説明します。 | |
MaxComputeでよく使用されるコマンドについて説明します。 このモジュールは、MaxComputeの操作に慣れるのに役立ちます。 | |
MaxComputeクライアントやMaxCompute Studioなど、MaxComputeの一般的なツールについて説明します。 データを分析する前に、ツールに慣れておく必要があります。 | |
さまざまなリージョンでサポートされているネットワーク接続モードと、各リージョンに対応するエンドポイントについて説明します。 このモジュールでは、MaxComputeがElastic Compute Service (ECS) 、Tablestore、Object Storage Service (OSS) などの他のAlibaba Cloudサービスに接続されているときに発生する可能性のある問題についても説明します。 これらの問題には、ネットワーク接続の問題やデータダウンロード料金に関する問題が含まれます。 |
データアナリスト
データアナリストの場合は、SQLのトピックに慣れることをお勧めします。 MaxComputeに保存されている大量のデータをクエリおよび分析できます。 次の表に、MaxCompute SQLが提供する機能を示します。
機能 | 説明 |
テーブル、パーティション、列、ライフサイクル、およびビューを管理できます。 | |
テーブルやパーティションにデータを挿入したり、データを更新したりできます。 | |
SELECTやサブクエリなど、さまざまなクエリ操作を実行できます。 | |
コマンドを使用して、MaxComputeテーブルからのデータのインポートとエクスポート、テーブルデータの複製などのSQL拡張操作を実行できます。 | |
MaxCompute組み込み関数 (数学関数、ウィンドウ関数、日付関数、集計関数、文字列関数など) を使用してデータを処理できます。 | |
コンピューティング要件を満たすユーザー定義関数 (UDF) を作成できます。 |
開発経験のあるユーザー
開発経験があり、分散アーキテクチャを理解し、SQLが提供できないデータ分析機能を取得したい場合は、MaxComputeの高度な機能モジュールに慣れることをお勧めします。
モジュール | 説明 |
MaxComputeは、MapReduceプログラミングモデルをJavaで提供します。 MapReduceが提供するJava APIを使用して、MapReduceプログラムを記述し、MaxComputeでデータを処理できます。 | |
グラフは、反復グラフ計算の処理フレームワークです。 グラフは頂点とエッジで構成され、どちらも値を含みます。 MaxCompute Graphは、グラフを繰り返し編集および展開して分析結果を取得します。 | |
MaxCompute Tunnelを使用すると、一度にMaxComputeとの間で大量のデータをアップロードまたはダウンロードできます。 | |
MaxComputeは、開発者向けのJava SDKを提供します。 | |
MaxComputeは、開発者向けにPython用のSDKを提供します。 |
プロジェクトの所有者または管理者
プロジェクトの所有者または管理者である場合は、次の表に記載されているモジュールに慣れることをお勧めします。 プロジェクト所有者はプロジェクトを作成して使用でき、プロジェクト管理者はプロジェクト、セキュリティ操作、およびコストを管理できます。
モジュール | 機能 | 説明 |
プロジェクト管理 | プロジェクト作成の準備 | プロジェクトは、MaxComputeの基本的な組織単位です。 従来のデータベースシステムのデータベースまたはスキーマと同様に、プロジェクトを使用してユーザーを分離し、アクセス要求を制御します。 ユーザーは複数のプロジェクトに対する権限を持つことができます。 ユーザーに関連するアクセス許可が付与されると、ユーザーはプロジェクト間でテーブル、リソース、関数、インスタンスなどのオブジェクトにアクセスできます。 MaxComputeは、プロジェクト内のさまざまなオブジェクトを管理するために使用されます。 プロジェクトを作成する前に、次の準備をする必要があります。
|
プロジェクトの作成 | 詳細については、「MaxComputeプロジェクトの作成」をご参照ください。 | |
プロジェクトメンバーの管理 | メンバーは、メンバーの責任とセキュリティ要件に基づいて管理されます。 DataWorksコンソールでMaxComputeを使用する場合、MaxComputeとDataWorksの間の権限関係を理解する必要があります。 . | |
RAMユーザーの管理 | Alibaba CloudアカウントまたはRAMユーザーの資格情報を使用して、MaxComputeプロジェクトを管理できます。 Alibaba CloudアカウントのRAMユーザーをMaxComputeプロジェクトに追加できます。 RAMユーザーの詳細については、「RAMユーザーの準備」をご参照ください。 DataWorksコンソールでMaxComputeプロジェクトとDataWorksワークスペースを管理する場合、Alibaba CloudアカウントのRAMユーザーのみをメンバーとして追加できます。 したがって、Alibaba Cloudアカウントを使用してRAMユーザーを作成し、Resource Access Management (RAM) コンソールでこれらのRAMユーザーを管理する必要があります。 説明
| |
スケジューリングリソースの管理 | DataWorksのスケジューリングリソースを管理する必要があります。 これらのリソースは、スケジューリングシステムによって配信されるタスクを実行または分散するために使用されます。 DataWorksのスケジューリングリソースは、次のタイプに分類されます。
| |
プロジェクトの設定 | プロジェクトの所有者だけが、プロジェクトを構成する権限を持っています。 たとえば、プロジェクト所有者は、フルテーブルスキャンを有効にするかどうか、およびMaxCompute V2.0データ型エディションを有効にするかどうかを指定できます。 詳細については、「プロジェクト操作」をご参照ください。 | |
コスト管理 | なし | リソースの予算は、リソースを使用する前にコストを見積もるのに役立ちます。 MaxComputeの課金方法が異なるため、正確なコストを見積もることは困難です。 ビジネス開発プロセス全体でコストを管理する必要があります。 |