データ伝送セキュリティ
Platform for AI (PAI) にデプロイされたモデルサービスのデータ転送セキュリティを強化するために、公式SDK for Pythonを使用するか、カスタムロジックを実装して、仮想プライベートクラウド (VPC) 経由でサービスにアクセスできます。 VPCは互いに分離されているため、プライベート高速アクセスが保証されます。
VPCセキュリティの詳細については、「セキュリティシステムの概要」をご参照ください。
データストレージのセキュリティ
PAIは、パブリックデータセットまたはAlibaba Cloudストレージサービスに保存されているデータを使用してデータセットを作成できるデータセット管理モジュールを提供します。 このモジュールでは、Object Storage Service (OSS) フォルダーをスキャンして、インテリジェントなラベリングやモデルトレーニングに使用できるインデックスデータセットを生成することもできます。
データセットやモデルなどのデータファイルのストレージセキュリティを確保するために、次のAlibaba Cloudストレージサービスを使用することを推奨します。
データストレージサービス | 関連トピック |
OSS | |
ファイルストレージNAS | |
クラウドディスク | |
MaxCompute |
データのバックアップと復元
PAIを使用すると、イメージを使用してユーザー環境とデータセットをバックアップおよび復元できます。 たとえば、イメージを作成して、インスタンスのデータ、エンジニアリング環境、構成を保存できます。 これにより、ビジネス要件に基づいてイメージをデプロイすることができ、データ損失に対する保護手段が提供されます。 Alibaba Cloudストレージサービスを使用してデータまたはデータセットを保存する場合、対応するサービスによってバックアップと復元が保証されます。
データストレージサービス | 関連トピック |
OSS | |
ファイルストレージNAS | |
MaxCompute |
PyTorchを使用して基礎モデルをトレーニングする場合、EasyCkptを使用してモデルトレーニングの進行状況を保存および再開し、データの損失やリソースの無駄を最小限に抑えることができます。 EasyCkptは、PAIが提供する高性能チェックポイントフレームワークであり、人気のあるモデルトレーニングフレームワークであるMegatronおよびDeepSpeedと互換性があります。 詳細については、「EasyCkptを使用した基礎モデルのトレーニングの保存と再開」をご参照ください。