PAI-EasyVision は、ビジュアルインテリジェンス向けの高度なアルゴリズムパッケージです。さまざまなモデルのトレーニングおよび予測機能を提供します。PAI-EasyVision を使用して、アプリケーション向けのコンピュータビジョン (CV) モデルを構築し、適用します。
ディープラーニングテクノロジーの急速な発展に伴い、コンピュータビジョンは大規模な商用アプリケーションに参入しました。CV アプリケーション開発者にとって、ディープラーニングを使用して CV モデルを構築することは、いくつかの課題を提示します。
-
ディープラーニングアルゴリズムコードの開発とデバッグにはコストがかかります。
-
モデルは迅速に更新および反復され、その原則と詳細を理解するには時間がかかります。
-
アルゴリズムトレーニングと推論パフォーマンスの最適化には、専門的なシステム知識が必要です。
-
データアノテーションコストは高額です。
-
PAI でオープンソースアルゴリズムを直接使用するには、学習曲線と適応コストがかかります。
これらの課題を克服するために、PAI は PAI-EasyVision を提供します。これは、CV モデリング向けのユーザーフレンドリーなフレームワークであり、CV アプリケーション開発者が本番環境向けのビジュアルモデルを迅速に構築およびデプロイするのに役立ちます。主な利点:
-
使いやすさ
マルチタスキング、モジュール式、プラグイン可能なアトミック関数インターフェイスを通じて、さまざまな視覚タスクをサポートします。 機能は、データ I/O や前処理からモデルトレーニング、オフライン予測まで、モデリングプロセス全体を網羅しています。 Designer や Data Science Workshop (DSW) などの複数の環境で PAI-EasyVision を使用できます。
-
パフォーマンス
PAI-TensorFlow の複数の最適化エンジンをカプセル化し、分散トレーニング、コンパイル最適化、および混合精度をサポートします。シンプルなファイルを構成して、PAI で高性能を実現します。オープンソースの TensorFlow システムと互換性があります。
-
モデルの多様性
オープンソースデータセットで事前学習済みの多くのモデルを提供します。光学文字認識 (OCR) モデルなど、PAI の強力なモデルを統合し、開発およびトレーニングコストを削減します。
アーキテクチャ
PAI-EasyVision は Model Zoo を大幅に拡張し、多くのモデルのトレーニングおよび予測機能を提供します。PAI-VIP、PAIコマンド、および DSW など、柔軟な呼び出し方法をサポートし、さまざまなユーザーのモデリングニーズに対応します。PAI-EasyVision は、オフライン予測向けに柔軟で高可用性の分散パイプラインアーキテクチャを使用しており、数億のデータレコードをオフラインで迅速に処理できます。PAI のシステムおよびモデル最適化機能は、Elastic Algorithm Service (EAS) での予測向けに、より小さく高速なモデルを作成するのに役立ちます。さらに、PAI-EasyVision は、既存の機能と最適化を再利用するためのトレーニングおよび予測用のカスタムインターフェイスをサポートします。次の図にアーキテクチャを示します。
機能
-
使いやすさ
さまざまなユーザーのニーズに対応します。一部のユーザーはシンプルな操作でモデルをトレーニングしたいと考えるかもしれません。また、トレーニングや予測タスクをスケジュールしたいユーザーもいるでしょう。さらに、既存の PAI-EasyVision モジュールを再利用し、モデル構造を調整して再トレーニングしたいと考えるユーザーもいます。これらのニーズをサポートするために、PAI-VIP、PAIコマンド、または DSW を使用して PAI-EasyVision を呼び出します。
-
パフォーマンス最適化
PAI-TensorFlow に基づく分散トレーニングパフォーマンス向けに最適化されています。単一および複数のマルチ GPU サーバーの両方で高性能な分散トレーニングをサポートします。また、グラフ最適化やモデル圧縮を含む、推論ステージ向けのモデル最適化もサポートします。
-
PAI Smart Labeling との連携
PAI Smart Labeling と統合されています。提供されている変換ツールを使用して、PAI ラベリングフォーマットのファイルをトレーニング用の TFRecord に変換します。また、トレーニング中にトレーニングデータセットを動的に拡張するための豊富なデータ拡張モジュールも提供します。
-
効率的なオフライン予測
PAI-EasyVision でトレーニングされたモデルを使用したオフラインデータ処理を容易にする、予測用のマルチサーバーパイプラインシステムを提供します。各処理ステップは、マルチサーバーおよびマルチスレッドアクセラレーションをサポートします。ステップはパイプラインで非同期的に処理され、効率が大幅に向上します。オフライン予測プロセスの各ステップをカスタマイズします。
-
EAS との連携
トレーニングプロセスは SavedModel ファイルを生成します。このファイルを独自のオンライン予測システムに統合します。EAS は強力なオンライン予測サービスを提供し、PAI-EasyVision EAS Python Processor を実装します。リアルタイムでデータを処理するには、構成ファイルでモデルアドレスとモデルタイプを構成します。