Data Science Workshop (DSW) は、AI 開発のためのクラウドベースの IDE を提供します。Jupyter Notebook や Visual Studio Code のようなツールに慣れている場合は、すぐにモデル開発を始めることができます。このドキュメントでは、DSW インスタンスの作成方法と一般的な問題のトラブルシューティング方法について説明します。
基本的な DSW インスタンスを迅速に作成する
PAI コンソールにログインし、[リージョン] を選択し、左側のナビゲーションウィンドウで [ワークスペースリスト] をクリックします。ターゲットワークスペースを選択して入力します。
左側のナビゲーションウィンドウで、[インタラクティブモデリング (DSW)] > [インスタンスの作成] をクリックします。次の主要なパラメーターを設定し、その他はデフォルト設定のままにします。コンソールパラメーターの完全なリストについては、「コンソールパラメーターの完全なリスト」をご参照ください。
パラメーター | 説明 |
インスタンス名 | 例: dsw_test。 |
リソースタイプ | [パブリックリソース] を選択します。このリソースタイプは従量課金方式を使用します。 |
インスタンスタイプ | 例: ecs.gn7i-c8g1.2xlarge (1 × A10 GPU、8 vCPU、30 GiB メモリ)。 このインスタンスタイプが在庫切れの場合は、リストから別のインスタンスタイプを選択してみてください。 |
イメージ構成 | [公式イメージ] を選択し、modelscope:1.31.0-pytorch2.8.0-gpu-py311-cu124-ubuntu22.04 (Python 3.11、CUDA 12.4) を検索して選択します。 ModelScope イメージは、幅広い互換性と包括的なサードパーティライブラリのセットを備えているため、使用することをお勧めします。 |
[OK] をクリックしてインスタンスを作成します。インスタンスのステータスが [実行中] に変わると、準備完了です。
インスタンスの起動に失敗した場合は、「DSW インスタンスの起動時によくある問題」をご参照ください。
DSW インスタンスリストページでインスタンスを見つけ、[操作] 列の [開く] をクリックして DSW インスタンスに移動し、モデル開発を開始します。
DSW インスタンスインターフェイスの機能、および DSW インスタンスの停止、リリース、または変更方法の詳細については、「コンソールで DSW インスタンスにアクセスして管理する」をご参照ください。
警告 パブリックリソースを使用して DSW インスタンスを作成すると、インスタンスの稼働時間に基づいて課金が開始されます。不要な料金を避けるため、使用しないときはインスタンスを停止または削除してください。
この例で作成された DSW インスタンスのシステムディスクは無料のクラウドディスクです。インスタンスが 15 日間以上連続して停止している場合、クラウドディスク上のデータは完全に削除され、回復できません。重要なデータは適時にバックアップするか、クラウドストレージサービスをマウントしてデータを転送してください。
一般的なユースケースのための構成
基本的な DSW インスタンスは、すべての AI 開発ニーズを満たすとは限りません。次の表は、一般的なユースケースの構成をまとめたものです。
ユースケース | ニーズ / 課題 | 主要な構成 | 関連ドキュメント |
コードとデータを永続的に保存する | DSW インスタンスのシステムディスクは一時的なストレージを提供します。インスタンスが削除されたり、長期間停止したままになるとデータは削除されます。 重要なファイルを長期間使用するために保存したり、複数のインスタンス間でデータを共有したりします。
| [データセットのマウント] または [ストレージパスのマウント] を使用して、Object Storage Service (OSS) などのクラウドストレージをインスタンス上の指定されたフォルダにマウントします。 | データセット、OSS バケット、NAS ファイルシステム、または CPFS ファイルシステムをマウントする |
パブリックネットワークのダウンロード速度を向上させる | DSW インスタンスはデフォルトで共有ゲートウェイを使用します。帯域幅の制限により、大きなファイルのダウンロード速度が不十分になる場合があります。 | ネットワーク情報セクションで、[Virtual Private Cloud (VPC)] を構成し、[専用ゲートウェイ] を使用します。これには、VPC 用の NAT Gateway と Elastic IP Address (EIP) も必要です。 | リモート接続: SSH を使用して直接接続する |
SSH を使用してリモートで開発する | Web ベースの IDE に限定されず、VSCode や PyCharm などのローカルツールを使用して開発とデバッグを行います。 | アクセス構成で、[SSH を有効にする] を選択し、[SSH 公開鍵] を入力し、[パブリックネットワークアクセス] を選択します。既存の NAT Gateway と Elastic IP Address (EIP) を関連付けます。 | 専用ゲートウェイを使用してパブリックネットワークのアクセス速度を向上させる |
インスタンス内の Web サービスにアクセスする | インスタンス内で実行されている Web アプリケーションをパブリックインターネットに公開し、URL を介してアクセスまたは共有できるようにします。 | アクセス構成で、[カスタムサービス] を追加し、サービスポートを構成し、パブリックネットワークアクセスを有効にします。セキュリティグループにインバウンドルールを追加して、そのポートでのトラフィックを許可します。 | インターネット経由でインスタンス内のサービスにアクセスする |
コンソールパラメーターの完全なリスト
基本情報
パラメーター | 説明 |
インスタンス名 | インスタンスに一意でわかりやすい名前を入力します。 |
タグ | ビジネスニーズに基づいてインスタンスにタグを追加し、多次元検索、特定、バッチ操作、および課金を容易にします。 |
環境情報
パラメーター | 説明 |
イメージ構成 | [公式イメージ] に加えて、次のイメージタイプがサポートされています: [カスタムイメージ]: PAI に追加されたカスタムイメージを使用できます。イメージリポジトリはパブリックプルを許可するように設定するか、イメージを Container Registry (ACR) に保存する必要があります。詳細については、「カスタムイメージ」をご参照ください。 [イメージ URL]: パブリックネットワークでアクセス可能なカスタムイメージまたは公式イメージの URL を構成できます。
|
システムディスク | 開発中にファイルを保存するために使用されます。[リソースタイプ] を [パブリックリソース] に設定した場合、または [リソースクォータ] をサブスクリプションの一般計算リソース (CPU コア ≥ 2 およびメモリ ≥ 4 GB、または GPU 搭載) に設定した場合、各インスタンスはシステムディスクとして 100 GiB の無料ディスクを受け取ります。ディスクを拡張できます。拡張価格はコンソールインターフェイスに従います。
警告 クラウドディスクの無料クォータのみを使用する場合、インスタンスが 15 日間以上連続して停止していると、その内容は削除されます。 拡張後、クラウドディスク全体 (無料部分と有料部分) は 15 日間の停止制限の対象外となりますが、停止中も料金が発生し続けます。 拡張後のディスクサイズのダウングレードはサポートされていません。必要に応じてディスクを拡張してください。 インスタンスが削除されると、クラウドディスクも削除されます。削除する前に、必要なすべてのデータをバックアップしてください。
永続ストレージを使用するには、[データセットのマウント] または [ストレージパスのマウント] を構成します。 |
データセットのマウント | 読み取り用のデータセットを保存したり、開発中に作成されたファイルを永続化したりします。次の 2 種類のデータセットがサポートされています: [マウントパス]: データセットが DSW インスタンスにマウントされるパスです。例: /mnt/data。コードからこのパスを使用してデータセットにアクセスします。
説明 複数のデータセットのマウントパスは同じにできません。 CPFS タイプのデータセットを構成する場合、ネットワーク設定を構成し、選択した VPC が CPFS で使用されているものと同じであることを確認する必要があります。そうしないと、DSW インスタンスの作成に失敗します。 リソースグループが専用リソースグループの場合、最初のデータセットは NAS タイプである必要があり、指定したパスとデフォルトの DSW 作業ディレクトリ /mnt/workspace/ の両方にマウントされます。
マウントの詳細については、「データセット、OSS バケット、NAS ファイルシステム、または CPFS ファイルシステムをマウントする」をご参照ください。 |
ストレージのマウント | ストレージマウントを使用して、データセットにアクセスしたり、ファイルを永続化したりします。 マウントの詳細については、「データセット、OSS バケット、NAS ファイルシステム、または CPFS ファイルシステムをマウントする」をご参照ください。 |
作業ディレクトリ | JupyterLab と Web IDE の起動ディレクトリです。デフォルトは /mnt/workspace です。 |
クリックしてその他の構成を展開
パラメーター | 説明 |
カスタム起動スクリプト | インスタンスの起動時に環境をカスタマイズしたり、初期化タスクを実行したりします。カスタムスクリプトは、イメージとリソースの準備ができた後、JupyterLab や Web IDE などの開発アプリケーションが起動する前に実行されます。 |
環境変数 | メインコンテナーの起動、システムプロセス、およびユーザープロセスに使用されます。必要に応じて、カスタム環境変数を追加したり、システムのデフォルトをオーバーライドしたりします。 注: 次の環境変数を変更しないでください: # 変更は効果がありません
USER_NAME # サービス内のロジックによって上書きされます
# 変更が推奨されないシステム変数。変更すると通常の使用に影響する可能性があります。
JUPYTER_NAME: デフォルトではインスタンス情報から構築されます。jupyterlab の URL アクセスパスを変更するために使用できます。
JUPYTER_COMMAND: Jupyter の起動コマンド。デフォルトは jupyterlab を起動するために lab に設定されています。
JUPYTER_SERVER_ADDR: JupyterLab サービスのリスニングアドレス。デフォルトは 0.0.0.0 です。
JUPYTER_SERVER_PORT: JupyterLab サービスのリスニングポート。デフォルトは 8088 です。
JUPYTER_SERVER_AUTH: JupyterLab のアクセスパスワード。デフォルトは空です。
JUPYTER_SERVER_ROOT: Jupyter の作業ディレクトリ。優先度は WORKSPACE_DIR より低いです。
CODE_SERVER_ADDR: code-server サービスのリスニングアドレス。デフォルトは 0.0.0.0 です。
CODE_SERVER_PORT: code-server サービスのリスニングポート。デフォルトは 8082 です。
CODE_SERVER_AUTH: code-server のアクセスパスワード。デフォルトは空です。
WORKSPACE_DIR: システムは、インスタンス作成時に設定された作業ディレクトリパラメーターに基づいてこの環境変数を設定します。jupyter と code-server の起動ディレクトリを変更できます。パスが存在しない場合、エラーが発生する可能性があります。
|
高度な構成 | サービスで必要な特定のセキュアカーネルパラメーターを調整します。これは現在、Lingjun リソースグループインスタンスでのみサポートされています。パラメーターの詳細については、以下の表をご参照ください。 |
高度な構成パラメーター | デフォルト値 | 説明 | 注 |
VmMaxMapCount | 65530 | プロセスが持つことができるメモリマップ領域の最大数を設定します。たとえば、1024000 に設定できます。 | 65530 未満の値は効果がありません。値が高すぎると、メモリリソースの浪費につながる可能性があります。 |
ネットワーク情報
パラメーター | 説明 |
VPC 構成 | このパラメーターは、[リソースタイプ] が [パブリックリソース] に設定されている場合にのみ使用できます。 Virtual Private Cloud (VPC) 内で DSW インスタンスを使用するには、DSW インスタンスと同じリージョンに VPC を作成し、このパラメーターを構成します。また、[VSwitch] と [セキュリティグループ] を構成する必要があります。さまざまなシナリオの構成ポリシーの詳細については、「ネットワーク構成」をご参照ください。 |
パブリックネットワークゲートウェイ | 次の構成方法がサポートされています: [パブリックゲートウェイ]: ネットワーク帯域幅が制限されています。ユーザーの同時実行性が高い期間や大きなファイルをダウンロードする場合、ネットワーク速度が不十分になる可能性があります。 [専用ゲートウェイ]: パブリックゲートウェイの帯域幅制限を解決するには、DSW インスタンスの VPC にパブリック NAT Gateway を作成し、EIP をバインドし、SNAT エントリを構成します。詳細については、「専用ゲートウェイでパブリックネットワークのアクセス速度を向上させる」をご参照ください。
次のパラメーターは、CPFS データセットがマウントされている場合にのみ使用できます:
説明 CPFS データセットがマウントされている場合は、VPC を構成する必要があり、選択した VPC は CPFS で使用されているものと同じである必要があります。 |
アクセス構成
パラメーター | 説明 |
SSH を有効にする | インスタンスへのリモート接続用です。このオプションは、VPC を選択した後にのみ使用できます。有効にすると、SSH という名前の [カスタムサービス] が表示されます。カスタムイメージを使用する場合は、sshd がインストールされていることを確認してください。 |
SSH 公開鍵 | [SSH 構成] スイッチをオンにした後、このパラメーターを構成できます。
説明 VPC とパブリックネットワークの両方のログインをサポートするには、複数のクライアントから公開鍵を追加します。各公開鍵を新しい行に追加します。最大 10 個の公開鍵を追加できます。 |
カスタムサービス | SSH リモートアクセスまたはインターネット経由でインスタンス内のサービスにアクセスするために使用されます。 |
VPC アクセス用のドメイン名を作成 | 内部権威ドメイン (PrivateZone) を作成します。VPC 内でこのドメインを使用して、インスタンスの SSH サービスまたは他のカスタムサービスにアクセスし、インスタンスの IP アドレスが変更されることによる不便を回避します。PrivateZone ドメインの作成には料金が発生します。詳細については、「Alibaba Cloud DNS プロダクトの課金」をご参照ください。 |
NAT Gateway | パブリックネットワークからインスタンス内のサービスにアクセスする場合、このゲートウェイはパブリックリクエスト (EIP:Port) をプライベート DSW インスタンス (プライベート IP:Port) にマッピングします。 |
Elastic IP Address | パブリックネットワークからインスタンス内のサービスにアクセスするためのパブリック IP アドレスを提供します。 |
ロールと権限
パラメーター | 説明 |
可視性 | [インスタンス所有者のみに表示] または [ワークスペース内で公開] を選択します。 |
インスタンス所有者 | ワークスペース管理者のみがインスタンス所有者を変更できます。 |
[その他の構成を展開]
パラメーター | 説明 |
インスタンス RAM ロール | RAM ロールをインスタンスに関連付けて、他のクラウドリソースへのアクセスを許可します。このメソッドは、STS からの一時的な資格情報を使用して他のクラウドリソースにアクセスするため、長期的な AccessKey の使用を回避し、キー漏洩のリスクを軽減します。 次のオプションが利用可能です:
[デフォルトの PAI ロール]: 内部 PAI プロダクト、MaxCompute、および OSS へのアクセス権限を持ちます。デフォルトの PAI ロールに基づいて発行された一時的なアクセス資格情報は、内部 PAI プロダクトおよび MaxCompute テーブルにアクセスする際に、DSW インスタンス所有者と同等の権限を持ちます。OSS にアクセスする場合、現在のワークスペースに構成されているデフォルトのストレージパスバケットにのみアクセスできます。 [カスタムロール]: カスタマイズされた、またはより詳細な権限管理のためにカスタムロールを構成します。 [ロールを関連付けない]: AccessKey を使用して他のクラウドプロダクトに直接アクセスする場合は、これを選択します。
インスタンス RAM ロールの構成の詳細については、「DSW インスタンスのインスタンス RAM ロールを構成する」をご参照ください。 |
よくある質問
DSW インスタンスの起動時によくある問題
クリックして展開
Q: DSW インスタンスの起動に失敗する
トラブルシューティング: DSW インスタンス名をクリックします。エラーメッセージは [イベント] タブに表示されます。

以下は一般的なエラーとその解決策です:
現在、リクエストされたリソースタイプ [ecs.******] が不足しています。他のリージョンまたは他のリソースタイプを試してください
リソース使用量がデフォルトの制限を超えました。制限を引き上げるには、チケットシステムでお問い合わせください。
指定されたゾーンでは、このリソースの販売が一時的に停止されています。リソース不足のリスクを回避するために、マルチゾーン作成機能を使用することをお勧めします。
解決策: リソース不足のリスクを回避するために、次の操作を試すことができます:
CommodityInstanceNotAvailableError: 過去の長期延滞により、商品インスタンスはリリースされました。新しいインスタンスを作成して使用してください
現在の ECI インスタンスの課金は停止されましたが、関連リソースはまだクリーンアップ中です。
クラスターリソースは完全に利用されています。後で試すか、他のリージョンを試してください。
指定されたインスタンスが在庫切れのため、ECI の作成に失敗しました。在庫切れのリスクを回避するために、マルチゾーン作成機能を使用することをお勧めします。
原因: 指定された計算リソースが在庫切れです。
解決策: 次の操作を試すことができます:
リージョンを切り替えます。
インスタンスタイプを変更します。保留中のインスタンスのインスタンスタイプは変更できません。インスタンスを停止してからインスタンスタイプを変更する必要があります。
勤務時間外など、オフピーク時にインスタンスを使用します。
上記の方法で問題が解決しない場合は、ビジネス マネージャーにお問い合わせください。
back-off 10s restarting failed container=dsw-notebook pod
vSwitch のある利用可能なゾーンが在庫切れです
「ワークスペースメンバーが見つかりません」というメッセージで起動に失敗しました
解決策: ワークスペース管理者に連絡して、アカウントをワークスペースのメンバーとして追加してもらいます。
containerd コンテナーの作成に失敗しました: アーカイブからのレイヤーの準備に失敗しました: アーカイブクォータの検証に失敗しました ...
その他の起動失敗の理由:
Q: DSW インスタンスの起動時に Python ファイルを実行できますか?
はい、DSW インスタンスを作成するか、インスタンス構成を変更するときに [カスタム起動スクリプト] を設定できます。

この機能を使用して、インスタンスの起動時に環境をカスタマイズしたり、初期化タスクを実行したりできます。カスタムスクリプトは、イメージとリソースの準備ができた後、JupyterLab や Code Server などの開発者アプリケーションが起動する前に実行されます。
Q: DSW インスタンスが見つかりませんか?
概要ページでは、異なるリージョンで作成されたさまざまなタイプのインスタンスを表示できます。リージョンを切り替えてインスタンスを見つけてみてください。

Q: DSW ページが異常または応答しない場合はどうすればよいですか?
空白のページ、読み込みが続く Notebook、コマンドを受け付けない Terminal などの問題は、通常、ローカル環境に関連しています。次のトラブルシューティング手順を試してください:
ブラウザのキャッシュをクリアして、もう一度試してください。
ブラウザのシークレットモードまたはプライベートモードを使用してページにアクセスします。
ネットワーク環境を変更します。たとえば、会社の内部ネットワークからモバイルホットスポットに切り替えて、ファイアウォールの制限を確認します。
Chrome や Firefox など、別のブラウザを使用してみてください。
Q: ディスクをシステムディスクとして使用する DSW インスタンスが停止、再起動、インスタンスタイプの変更、またはイメージの置き換えが行われた場合、システムディスク上のデータは失われますか?
クラウドディスクをシステムディスクとして使用する DSW インスタンスには、パブリックリソースグループで作成されたインスタンスと、システムディスクとして [ディスク] を選択した汎用リソースインスタンスが含まれます。これらのインスタンスのシステムディスク上のデータは、次のように影響を受けます:
インスタンスの停止: データが失われる可能性があります。ディスクが拡張されておらず、インスタンスが 15 日以上停止したままである場合、データは削除され、回復できません。ディスクが拡張されているか、インスタンスが 15 日以下停止している場合、データは失われません。
インスタンスの再起動: データは失われません。インスタンスが停止または再起動された後、pip を使用してインストールされたすべてのパッケージ、コードファイル、およびシステムディスク上のその他のデータは保持されます。
インスタンスタイプの変更: データは失われません。CPU、メモリ、GPU 構成などのインスタンスタイプを調整しても、システムディスク上のデータには影響しません。
イメージの置き換え: 一部のデータが失われる可能性があります。イメージを変更しても、マウントされたデータセットや OSS のデータには影響しません。ただし、システムディスク上のコンテンツはリセットされる可能性があります。したがって、イメージを変更する前にインスタンスデータを保存してください。たとえば、データをデータセットや OSS にコピーまたは移動できます。詳細については、「データセット、OSS、NAS、または CPFS をマウントする」をご参照ください。
システムディスクとして [一時ストレージ] を使用する汎用リソースインスタンスの場合、AI リソースグループがサブスクリプションディスクで構成されているかどうかに関係なく、インスタンスが停止、再起動、または仕様やイメージが変更されると、システムディスク上のすべてのデータが失われます。
Q: パブリックリソースを使用して作成された DSW インスタンスは、15 日以上ログインしなかった後にリリースされた場合、回復できますか?
パブリックリソースで作成された DSW インスタンスの場合、クラウドディスクシステムディスクが拡張されておらず、インスタンスが 15 日間以上連続して起動されていない場合、そのシステムディスクは自動的にクリアされ、回復できません。
DSW インスタンスの停止またはリリースに関する一般的な問題
クリックして展開
Q: DSW インスタンスをリリースするにはどうすればよいですか?
DSW インスタンスリストページで、インスタンスの [停止] または [削除] をクリックします。

注: DSW インスタンスを作成する際にシステムディスクを拡張した場合、インスタンスが実行中であるかどうかに関係なく、システムディスクの課金は継続されます。DSW インスタンスのすべての課金を停止するには、インスタンスを削除する必要があります。
Q: DSW インスタンスが見つからないのはなぜですか?
インスタンスが見つからない場合は、別のリージョンとワークスペースに切り替えてみてください。

Q: 無料トライアルリソースプランをリリースするにはどうすればよいですか?
無料トライアルリソースプランは、リリースまたは停止する必要はありません。
Q: DSW インスタンスの課金を完全に停止するにはどうすればよいですか?「停止」と「削除」の違いは何ですか?
選択方法:
Q: DSW インスタンスが「停止中」または「削除中」の状態でスタックし、操作が完了できないのはなぜですか?
システムがタスクを安全に終了し、状態を保存し、リソースを回収する必要があるため、インスタンスの停止または削除には時間がかかります。インスタンスが長時間応答しない場合、一般的な理由は次のとおりです:
この状況では、しばらく待ってからページを更新してください。インスタンスのステータスが [停止] に変わるはずです。
Q: DSW インスタンスを停止または削除した後、データとコードは失われますか?
データが保持されるかどうかは、操作とインスタンスのリソースグループタイプによって異なります。
Q: 実行中の DSW インスタンスが自動的に停止するのはなぜですか?
インスタンスには、アイドル時の自動シャットダウンポリシーが構成されています。このポリシーはリソースを節約するために設計されており、無料トライアルインスタンスではデフォルトで有効になっています。
Q: すべての DSW インスタンスを停止または削除しましたが、なぜまだ「実行中」と表示されたり、請求通知が届いたりするのですか?
次の一般的な理由を確認してください:
リソースプランとインスタンスを混同している。表示されている「実行中」のステータスは、インスタンスではなくリソースプラン (「月間 250 課金時間」など) を指している可能性があります。リソースプランは有効期間内は常にアクティブであり、そのステータスはインスタンスとは無関係です。
拡張されたシステムディスクはまだ課金されています。インスタンスを停止すると、コンピューティング料金のみが一時停止されます。拡張されたシステムディスクは、ストレージ料金が発生し続けます。
課金に遅延があります。課金はリアルタイムではありません。リソースを使用してから数時間後に請求書が生成される場合があります。たとえば、午前中に発生した料金は、午後まで請求書に表示されない場合があります。