Platform for AI (PAI) は、視覚知能のための強化されたアルゴリズムフレームワークであるEasyVisionを提供します。 EasyVisionは、さまざまなモデルトレーニングと予測機能を提供します。 EasyVisionを使用して、CVアプリケーションのコンピュータビジョン (CV) モデルをトレーニングおよび適用できます。
ディープラーニング技術の急速な発展は、CVの大規模な商業的利用を促進する。 CV開発者として、ディープラーニング技術を使用してCVモデルを構築すると、次の問題が発生する可能性があります。
深層学習アルゴリズムの開発とデバッグには高いコストが必要です。
モデルは頻繁に更新されます。 モデルがどのように機能するか、およびモデルのその他の詳細を理解するのに多くの時間を費やす必要があります。
アルゴリズムを訓練し、推論のパフォーマンスを向上させるには、専門的かつ体系的な知識を習得する必要があります。
データ注釈には高いコストが必要です。
PAIでオープンソースアルゴリズムを使用するには、アルゴリズムの学習と再構築に時間を費やす必要があります。
前述の問題を克服するために、PAIはEasyVisionを提供します。これは、モデルをトレーニングできるシンプルで使いやすいアルゴリズムフレームワークです。 EasyVisionを使用して、CVモデルを簡単に構築および適用できます。 EasyVisionには次の利点があります。
使いやすさ
EasyVisionは、さまざまなモジュールのさまざまなタスクを完了するために呼び出すことができるプラグ接続可能なAPI操作をサポートします。 さらに、EasyVisionは、データI/O、前処理、モデルトレーニング、オフライン予測などの豊富な機能を提供し、モデリングプロセス全体をサポートします。 EasyVisionは、Machine Learning StudioやPAIのData Science Workshop (DSW) などの複数のモジュールで使用できます。
高パフォーマンス
EasyVisionは、コンパイル、分散トレーニング、混合精度トレーニング用の最適化エンジンなど、PAI-TensorFlowのさまざまな最適化エンジンをカプセル化しています。 これらの最適化エンジンを使用して、関連する構成ファイルを構成することでシステムパフォーマンスを向上させることができます。 EasyVisionは、オープンソースのTensorFlowシステムでも使用できます。
豊富なモデル
EasyVisionは、光学式文字認識 (OCR) モデルなどのさまざまなモデルを提供します。 モデルは、オープンソースのデータセットに基づいてトレーニングされます。 これにより、開発とトレーニングのコストが削減されます。
アーキテクチャ
EasyVisionは、たくさんのモデルでモデル動物園を構築します。 さらに、EasyVisionは、さまざまなモデルトレーニングおよび予測機能を提供し、コマンド、ビデオインテリジェンスプラットフォーム (VIP) 、およびPAIのDSWと互換性があります。 このように、EasyVisionはさまざまなモデリング要件を満たすことができます。 EasyVisionは、オフライン予測に分散パイプラインアーキテクチャを使用します。 これは、EasyVisionが短期間で何億ものデータレコードをオフラインで処理できるようにする、柔軟で可用性の高いアーキテクチャです。 モデルは、PAIのElastic Algorithm Service (EAS) で予測を行うために使用できます。 PAIのシステムおよびモデル最適化機能により、より少ないパラメータで予測をより効率的に行うことができます。 さらに、EasyVisionを使用して、モデルのトレーニングと予測の操作をカスタマイズできます。 これにより、既存の機能を再利用してモデルを最適化できます。 次の図は、EasyVisionのアーキテクチャを示しています。
特徴
使いやすさ
モデルのトレーニングと予測に関する要件が異なる場合があります。 たとえば、モデルトレーニングの操作を簡素化し、スケジュールどおりにモデルトレーニングと予測タスクを実行し、既存のモデルとアルゴリズムを再利用することができます。 これらの要件を満たすために、EasyVisionはPAIのコマンド、VIP、およびDSWと互換性があります。
最適化されたパフォーマンス
EasyVisionは、PAI-TensorFlowに基づいて分散トレーニングを最適化します。 EasyVisionを使用すると、1つ以上のマルチGPUサーバーでモデルをトレーニングできます。 EasyVisionは、グラフの最適化やモデルの圧縮など、推論のパフォーマンスも向上します。
PAIのスマートラベリングへの接続
EasyVisionは、データのラベル付けに使用されるPAIのスマートラベリングに接続されています。 PAIは、ラベル付きデータを含むファイルをTFRecordファイルに変換する変換ツールを提供します。 TFRecordファイルを使用して、EasyVisionモデルをトレーニングできます。 さらに、EasyVisionは、トレーニング中にデータを動的に注入するための豊富なデータ拡張モジュールを提供します。
効率的なオフライン予測
EasyVisionでは、複数のサーバーを使用して同時に予測を行うことができます。 各サーバは別々にデータを処理する。 これにより、オフラインデータを使用して、EasyVisionによってトレーニングされたモデルに基づいて予測を行うことができます。 予測タスク内の各処理ジョブは、複数のサーバ上の複数のスレッドを使用することによって、高速に実行することができる。 すべてのジョブは1つずつ非同期に実行されます。 これにより、処理効率が向上する。 ジョブをカスタマイズすることもできます。
EASへの接続
SavedModelファイルは、トレーニング中に生成されます。 独自のシステムまたはEASでSavedModelファイルを使用して、オンライン予測を行うことができます。 EasyVisionは、EASの強力なオンライン予測機能をサポートするプロセッサを提供します。 設定ファイルでエンドポイントやタイプなどのモデル情報を指定した後、このプロセッサを使用してデータをリアルタイムで処理できます。