本ページでは、Alibaba クラウド DataWorks のアイデアと機能についての洞察を得るのに役立つように、DataWorks のデザインのアイデアとコア機能を紹介します。

コース概要

コース期間: 2 時間。オンライン学習方法を使用します。

コース対象: Java エンジニア、本番運用、人事など、DataWorks のすべての新旧ユーザーで、標準SQLに精通していれば、DataWorks の基本的なスキルをすぐに習得できます。 データウェアハウスと MaxCompute の仕組みについて精通している必要はありません。 ただし、DataWorks の基本概念および機能についての洞察を得るために、DataWorks コースをさらに学習することを推奨します。

コース目的: コースを修了した後、カリキュラムの一部として一般的な実世界の大量のログデータ分析タスクを実行します。DataWorks の主な特徴を理解し、コースに従った内容を実演し、独自でデータ収集、データ開発、タスク操作や様々なデータジョブの一般的なタスクを完了させることができるようになります。

本コースには以下が含まれます。
  • プロダクト紹介: DataWorks の開発履歴、全体のアーキテクチャ、各モジュールとそれらの関係について学びます。
  • データ取得: さまざまなデータソースから MaxCompute にデータを同期させる方法、タスク実行を迅速にトリガーする方法、タスクログを表示する方法などを学びます。
  • データ処理: データフローチャートの実行方法、新しいデータテーブルの作成方法、データ処理タスクノードの作成方法、タスクの定期的なスケジュールプロパティの設定方法を学びます。
  • データ品質: タスクのデータ品質に関するモニタリングルールを設定する方法を学び、タスクが品質の問題を確実に実行するようにします。

DataWorks 紹介

DataWorks は、データ統合、データモデリング、データ開発、運用、および運用モニタリング、データ管理、データセキュリティ、データ品質、およびその他のプロダクト機能を含む、MaxCompute を主な計算エンジンとして使用するビッグデータ研究開発プラットフォームです。 同時に、アルゴリズムプラットフォーム PAI を使用して、ビッグデータ開発からデータマイニングおよび機械学習への完全なリンクを確立します。

データ収集

データ収集の詳細については、「データ取得: ログデータアップロード」をご参照ください。

データ処理

データ処理の詳細については、「データ処理: ユーザーポートレート」をご参照ください。

データ品質

データ品質の詳細については、「データ品質モニタリング」をご参照ください。

質問への回答

学習の際に問題が発生した場合は、DingTalk グループ: 11718465 を追加することで、Alibaba クラウドテクニカルサポートへ相談することができます。