Data Science Workshop (DSW) は、AI 開発向けのクラウドベースの統合開発環境 (IDE) です。ノートブック (notebook)、VSCode (VSCode)、ターミナル (terminal) の 3 種類の開発環境を提供します。DSW には、PyTorch や TensorFlow など人気の AI フレームワーク向けに事前に構成済みのコンテナイメージが搭載されており、多様なヘテロジニアスコンピューティングリソースをサポートします。また、OSS、NAS、CPFS からデータセットをマウントすることで、開発ワークフローを効率化できます。
製品概要
DSW の開発環境を以下に示します。
新 UI

従来の UI

メリット
柔軟で使いやすい:DSW は複数の開発環境を統合し、PyTorch や TensorFlow などのオープンソースフレームワーク向けのコンテナイメージをサポートします。また、パブリックリソースや専用リソース(汎用計算リソースまたは Lingjun リソース)を含むさまざまなヘテロジニアスコンピューティングリソースを提供します。
エンドツーエンドのプラットフォーム:DSW には、分散トレーニング向けの PAI-DLC や、モデルをオンラインサービスとしてデプロイするための PAI-EAS などのツールが含まれており、データ処理・デバッグからモデルトレーニング・デプロイメントまで、AI 開発の全工程をカバーします。
細かい粒度での管理:DSW は、スケジュールによるシャットダウンやアイドル状態での自動シャットダウンなど、ライフサイクル設定をサポートし、コスト削減を実現します。ワークスペース機能により、グローバルなリソース割り当てと再利用が可能です。
実践的でシナリオに即したサンプル:「ノートブックギャラリー」では、LLM や AIGC といった最先端分野のチュートリアルおよびユースケースを提供しています。これらを活用して、すぐに作業を開始したり、自社プロジェクトの基盤として活用したりできます。
主な機能
作成と管理
DSW インスタンスの作成:リソースタイプを選択し、データセットをマウントし、必要に応じてカスタムコンテナイメージを指定します。
コンソールからの DSW のアクセスと管理:コンソールを使用して、DSW インスタンスの停止、削除、再構成などの操作を行います。
インスタンス RAM ロールの使用:インスタンスに RAM ロールを関連付けることで、一時的な STS 認証情報を使用して他のクラウドリソースにアクセスできます。これにより、長期的な AccessKey の使用を回避し、認証情報漏洩のリスクを低減できます。
モデル開発環境
サードパーティライブラリの管理:サードパーティの Python ライブラリおよびソフトウェアを管理・インストールします。
TensorBoard を使用したトレーニング可視化:TensorBoard 拡張機能を使用して、モデルトレーニング中のメトリックおよび情報を可視化します。
モデルをオンラインサービスとしてデプロイ:モデルのトレーニング完了後、PAI-EAS を使用して、オートスケーリング、バージョン管理、リソースモニタリングなどの機能を備えたオンラインサービスとしてデプロイします。
データへのアクセスとマウント
データセット、OSS、NAS、CPFS のマウント:データセットまたは OSS、NAS、CPFS からのストレージをインスタンスにマウントすることで、インスタンスストレージの拡張、データの永続化、データファイルの読み取りが可能です。
OSS へのデータの読み書き:API または SDK を使用して、DSW インスタンスから OSS へデータを読み書きします。
ファイルのアップロードおよびダウンロード:ローカルマシンと DSW インスタンス間でデータおよびモデルを転送します。
ネットワーク構成
SSH によるリモート接続:SSH 接続により、ローカル開発と同様の体験が得られ、DSW の強力な計算リソースを活用できます。
インターネット NAT Gateway を使用したパブリックネットワークアクセス速度の向上:インターネット NAT Gateway を作成し、ご利用のインスタンスが配置されている VPC に EIP をバインドすることで、ネットワークのアップロードおよびダウンロード速度を向上させます。
インターネット経由でのインスタンス内サービスへのアクセス:VPC 内またはパブリックインターネットから、インスタンス内で実行中のサービスにアクセスして、モデルのテストおよび検証を行います。
海外からのモデルまたはコンテナイメージのプル:DSW に対して Global Accelerator を構成することで、
docker.ioなどのソースからコンテナイメージを、またはhuggingface.coなどのソースからモデルを高速にプルできます。
課金
コンピューティングインスタンス
インスタンスタイプには、パブリックリソースおよび専用リソース(汎用計算リソースまたは Lingjun リソース)があり、それぞれ異なる課金方法が適用されます。
インスタンスタイプ | 課金方法 | 課金対象項目 | 課金ルール | 課金停止 |
パブリックリソース | 従量課金 | パブリックリソースを使用する DSW インスタンスのランタイム。 | パブリックリソースを使用するインスタンスのランタイムに対して課金されます。 重要 課金の詳細:DSW インスタンスは分単位で課金され、請求書は時間単位で生成されます。データ集約の関係上、請求書の反映が 2~3 時間遅れる場合があります。最終的な請求書が優先されます。 | DSW インスタンスを停止または削除します。 重要 インスタンスは手動で停止することも、スケジュールによるシャットダウンを設定することもできます。詳細については、「DSW インスタンスの管理」をご参照ください。 |
専用リソース(汎用計算リソースまたは Lingjun リソース) | サブスクリプション | ノード数およびサブスクリプション期間。 | 購入した専用リソースについて、ノード数およびサブスクリプション期間に基づいて課金されます。詳細については、「AI コンピューティングリソースの課金」をご参照ください。 | リソースのサブスクライブを解除します。 |
システムディスク
課金方法 | 課金対象項目 | 課金ルール | 課金停止 |
従量課金 | システムディスクの容量および使用期間。 | 各インスタンスタイプおよび仕様には、システムディスクの無料クォータが含まれています。容量を拡張した場合、追加ストレージ分に対して課金されます。 | DSW インスタンスを削除します。 |
課金に関する詳細については、「DSW の課金」をご参照ください。請求明細の確認については、「請求明細の確認」をご参照ください。
クイックスタート
新規ユーザーの方には、DSW のクイックスタートチュートリアルから始めることを推奨します。このチュートリアルでは、MNIST の手書き数字認識の例を使用して、DSW の基本的な理解と初期設定を迅速に習得できます。
ヘルプを表示
インスタンスの起動失敗、課金に関する質問、ネットワーク接続の問題など、一般的な課題に対する解決策については、「DSW のよくある質問」をご参照ください。