すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:DSW インスタンスの作成

最終更新日:Nov 05, 2025

Data Science Workshop (DSW) は、AI 開発のためのクラウドベースの IDE を提供します。Jupyter Notebook や Visual Studio Code のようなツールに慣れている場合は、すぐにモデル開発を始めることができます。このドキュメントでは、DSW インスタンスの作成方法と一般的な問題のトラブルシューティング方法について説明します。

基本的な DSW インスタンスを迅速に作成する

  1. PAI コンソールにログインし、[リージョン] を選択し、左側のナビゲーションウィンドウで [ワークスペースリスト] をクリックします。ターゲットワークスペースを選択して入力します。

  2. 左側のナビゲーションウィンドウで、[インタラクティブモデリング (DSW)] > [インスタンスの作成] をクリックします。次の主要なパラメーターを設定し、その他はデフォルト設定のままにします。コンソールパラメーターの完全なリストについては、「コンソールパラメーターの完全なリスト」をご参照ください。

    パラメーター

    説明

    インスタンス名

    例: dsw_test

    リソースタイプ

    [パブリックリソース] を選択します。このリソースタイプは従量課金方式を使用します。

    インスタンスタイプ

    例: ecs.gn7i-c8g1.2xlarge (1 × A10 GPU、8 vCPU、30 GiB メモリ)。

    このインスタンスタイプが在庫切れの場合は、リストから別のインスタンスタイプを選択してみてください。

    イメージ構成

    [公式イメージ] を選択し、modelscope:1.31.0-pytorch2.8.0-gpu-py311-cu124-ubuntu22.04 (Python 3.11、CUDA 12.4) を検索して選択します。

    ModelScope イメージは、幅広い互換性と包括的なサードパーティライブラリのセットを備えているため、使用することをお勧めします。

    [OK] をクリックしてインスタンスを作成します。インスタンスのステータスが [実行中] に変わると、準備完了です。

    インスタンスの起動に失敗した場合は、「DSW インスタンスの起動時によくある問題」をご参照ください。
  3. DSW インスタンスリストページでインスタンスを見つけ、[操作] 列の [開く] をクリックして DSW インスタンスに移動し、モデル開発を開始します。

    DSW インスタンスインターフェイスの機能、および DSW インスタンスの停止、リリース、または変更方法の詳細については、「コンソールで DSW インスタンスにアクセスして管理する」をご参照ください。

警告
  • パブリックリソースを使用して DSW インスタンスを作成すると、インスタンスの稼働時間に基づいて課金が開始されます。不要な料金を避けるため、使用しないときはインスタンスを停止または削除してください。

  • この例で作成された DSW インスタンスのシステムディスクは無料のクラウドディスクです。インスタンスが 15 日間以上連続して停止している場合、クラウドディスク上のデータは完全に削除され、回復できません。重要なデータは適時にバックアップするか、クラウドストレージサービスをマウントしてデータを転送してください。

一般的なユースケースのための構成

基本的な DSW インスタンスは、すべての AI 開発ニーズを満たすとは限りません。次の表は、一般的なユースケースの構成をまとめたものです。

ユースケース

ニーズ / 課題

主要な構成

関連ドキュメント

コードとデータを永続的に保存する

DSW インスタンスのシステムディスクは一時的なストレージを提供します。インスタンスが削除されたり、長期間停止したままになるとデータは削除されます。
重要なファイルを長期間使用するために保存したり、複数のインスタンス間でデータを共有したりします。

[データセットのマウント] または [ストレージパスのマウント] を使用して、Object Storage Service (OSS) などのクラウドストレージをインスタンス上の指定されたフォルダにマウントします。

データセット、OSS バケット、NAS ファイルシステム、または CPFS ファイルシステムをマウントする

パブリックネットワークのダウンロード速度を向上させる

DSW インスタンスはデフォルトで共有ゲートウェイを使用します。帯域幅の制限により、大きなファイルのダウンロード速度が不十分になる場合があります。

ネットワーク情報セクションで、[Virtual Private Cloud (VPC)] を構成し、[専用ゲートウェイ] を使用します。これには、VPC 用の NAT Gateway と Elastic IP Address (EIP) も必要です。

リモート接続: SSH を使用して直接接続する

SSH を使用してリモートで開発する

Web ベースの IDE に限定されず、VSCode や PyCharm などのローカルツールを使用して開発とデバッグを行います。

アクセス構成で、[SSH を有効にする] を選択し、[SSH 公開鍵] を入力し、[パブリックネットワークアクセス] を選択します。既存の NAT Gateway と Elastic IP Address (EIP) を関連付けます。

専用ゲートウェイを使用してパブリックネットワークのアクセス速度を向上させる

インスタンス内の Web サービスにアクセスする

インスタンス内で実行されている Web アプリケーションをパブリックインターネットに公開し、URL を介してアクセスまたは共有できるようにします。

アクセス構成で、[カスタムサービス] を追加し、サービスポートを構成し、パブリックネットワークアクセスを有効にします。セキュリティグループにインバウンドルールを追加して、そのポートでのトラフィックを許可します。

インターネット経由でインスタンス内のサービスにアクセスする

コンソールパラメーターの完全なリスト

基本情報

パラメーター

説明

インスタンス名

インスタンスに一意でわかりやすい名前を入力します。

タグ

ビジネスニーズに基づいてインスタンスにタグを追加し、多次元検索、特定、バッチ操作、および課金を容易にします。

リソース情報

パラメーター

説明

リソースタイプ

  • [パブリックリソース]: 従量課金方式で課金されます。これはサブスクリプションプランに変換できません。

    説明

    各 Alibaba Cloud アカウントは、パブリックリソースを使用する場合、リージョンごとに合計 2 つの GPU に制限されています。この制限を超えると、エラーが発生する可能性があります。クォータの増加をリクエストするには、チケットを送信してください。

    • [インスタンスタイプ]: GPU、CPU、または無料トライアルリソースを選択します。インスタンスタイプの詳細については、「インスタンスファミリー」をご参照ください。

    • [スポットインスタンスの購入]: このオプションを選択すると、スポットインスタンスを使用して実行コストを削減できます。[スポットインスタンスは現在在庫切れです] というプロンプトが表示された場合は、別のインスタンスタイプを試してください。

      このパラメーターは、中国 (杭州)、中国 (上海)、中国 (北京)、中国 (ウランチャブ)、中国 (深圳)、中国 (広州)、日本 (東京)、およびシンガポールリージョンでのみサポートされています。

  • [リソースクォータ]: 前払い (サブスクリプション) 方式で課金されます

    • [リソースクォータ]: 一般的な計算リソースまたは Lingjun リソースを選択できます。利用可能なリソースがない場合は、[リソースクォータの関連付け] をクリックして構成します。

    • [インスタンスタイプ]: 必要に応じて GPU、CPU、およびメモリを設定します。

    • [優先度]: 優先度レベルは 1 から 9 の範囲です。値が大きいほど優先度が高くなります。

    • [CPU アフィニティ]: コンテナーまたは Pod 内のプロセスを特定の CPU コアにバインドして実行します。これにより、CPU キャッシュミスとコンテキストスイッチが削減され、CPU 使用率とアプリケーションのパフォーマンスが向上します。この機能は、パフォーマンスに敏感なリアルタイムシナリオに適しています。このパラメーターは、中国 (北京) および中国 (深圳) リージョンでのみサポートされています。

環境情報

パラメーター

説明

イメージ構成

[公式イメージ] に加えて、次のイメージタイプがサポートされています:

  • [カスタムイメージ]: PAI に追加されたカスタムイメージを使用できます。イメージリポジトリはパブリックプルを許可するように設定するか、イメージを Container Registry (ACR) に保存する必要があります。詳細については、「カスタムイメージ」をご参照ください。

  • [イメージ URL]: パブリックネットワークでアクセス可能なカスタムイメージまたは公式イメージの URL を構成できます。

    • プライベートイメージ URL の場合は、[ユーザー名とパスワードを入力] をクリックし、イメージリポジトリのユーザー名とパスワードを構成します。

    • イメージのプル速度を上げるには、「イメージアクセラレーション」をご参照ください。

システムディスク

開発中にファイルを保存するために使用されます。[リソースタイプ][パブリックリソース] に設定した場合、または [リソースクォータ] をサブスクリプションの一般計算リソース (CPU コア ≥ 2 およびメモリ ≥ 4 GB、または GPU 搭載) に設定した場合、各インスタンスはシステムディスクとして 100 GiB の無料ディスクを受け取ります。ディスクを拡張できます。拡張価格はコンソールインターフェイスに従います。

警告
  • クラウドディスクの無料クォータのみを使用する場合、インスタンスが 15 日間以上連続して停止していると、その内容は削除されます。

  • 拡張後、クラウドディスク全体 (無料部分と有料部分) は 15 日間の停止制限の対象外となりますが、停止中も料金が発生し続けます。

  • 拡張後のディスクサイズのダウングレードはサポートされていません。必要に応じてディスクを拡張してください。

  • インスタンスが削除されると、クラウドディスクも削除されます。削除する前に、必要なすべてのデータをバックアップしてください。

永続ストレージを使用するには、[データセットのマウント] または [ストレージパスのマウント] を構成します。

データセットのマウント

読み取り用のデータセットを保存したり、開発中に作成されたファイルを永続化したりします。次の 2 種類のデータセットがサポートされています:

  • [カスタムデータセット]: トレーニングデータファイルを保存するためにカスタムデータセットを作成します。読み取り専用に設定し、特定のバージョンを選択できます。

  • [パブリックデータセット]: PAI は事前構築済みのパブリックデータセットを提供しており、読み取り専用モードでのみマウントできます。

[マウントパス]: データセットが DSW インスタンスにマウントされるパスです。例: /mnt/data。コードからこのパスを使用してデータセットにアクセスします。

説明
  • 複数のデータセットのマウントパスは同じにできません。

  • CPFS タイプのデータセットを構成する場合、ネットワーク設定を構成し、選択した VPC が CPFS で使用されているものと同じであることを確認する必要があります。そうしないと、DSW インスタンスの作成に失敗します。

  • リソースグループが専用リソースグループの場合、最初のデータセットは NAS タイプである必要があり、指定したパスとデフォルトの DSW 作業ディレクトリ /mnt/workspace/ の両方にマウントされます。

マウントの詳細については、「データセット、OSS バケット、NAS ファイルシステム、または CPFS ファイルシステムをマウントする」をご参照ください。

ストレージのマウント

ストレージマウントを使用して、データセットにアクセスしたり、ファイルを永続化したりします。

マウントの詳細については、「データセット、OSS バケット、NAS ファイルシステム、または CPFS ファイルシステムをマウントする」をご参照ください。

作業ディレクトリ

JupyterLab と Web IDE の起動ディレクトリです。デフォルトは /mnt/workspace です。

クリックしてその他の構成を展開

パラメーター

説明

カスタム起動スクリプト

インスタンスの起動時に環境をカスタマイズしたり、初期化タスクを実行したりします。カスタムスクリプトは、イメージとリソースの準備ができた後、JupyterLab や Web IDE などの開発アプリケーションが起動する前に実行されます。

説明
  • タイムアウトは 3 分です: カスタムスクリプトはインスタンスの起動時間を増加させ、3 分のタイムアウトがあります。スクリプト内でイメージのダウンロードなどの長時間実行タスクを実行しないでください。

  • スクリプト実行ログの表示: インスタンスの起動後、/var/log/user-command/ ディレクトリでカスタムスクリプトによって生成されたログを見つけることができます。

環境変数

メインコンテナーの起動、システムプロセス、およびユーザープロセスに使用されます。必要に応じて、カスタム環境変数を追加したり、システムのデフォルトをオーバーライドしたりします。

: 次の環境変数を変更しないでください:

# 変更は効果がありません
USER_NAME # サービス内のロジックによって上書きされます

# 変更が推奨されないシステム変数。変更すると通常の使用に影響する可能性があります。
JUPYTER_NAME: デフォルトではインスタンス情報から構築されます。jupyterlab の URL アクセスパスを変更するために使用できます。
JUPYTER_COMMAND: Jupyter の起動コマンド。デフォルトは jupyterlab を起動するために lab に設定されています。
JUPYTER_SERVER_ADDR: JupyterLab サービスのリスニングアドレス。デフォルトは 0.0.0.0 です。
JUPYTER_SERVER_PORT: JupyterLab サービスのリスニングポート。デフォルトは 8088 です。
JUPYTER_SERVER_AUTH: JupyterLab のアクセスパスワード。デフォルトは空です。
JUPYTER_SERVER_ROOT: Jupyter の作業ディレクトリ。優先度は WORKSPACE_DIR より低いです。
CODE_SERVER_ADDR: code-server サービスのリスニングアドレス。デフォルトは 0.0.0.0 です。
CODE_SERVER_PORT: code-server サービスのリスニングポート。デフォルトは 8082 です。
CODE_SERVER_AUTH: code-server のアクセスパスワード。デフォルトは空です。
WORKSPACE_DIR: システムは、インスタンス作成時に設定された作業ディレクトリパラメーターに基づいてこの環境変数を設定します。jupyter と code-server の起動ディレクトリを変更できます。パスが存在しない場合、エラーが発生する可能性があります。

高度な構成

サービスで必要な特定のセキュアカーネルパラメーターを調整します。これは現在、Lingjun リソースグループインスタンスでのみサポートされています。パラメーターの詳細については、以下の表をご参照ください。

高度な構成パラメーター

デフォルト値

説明

VmMaxMapCount

65530

プロセスが持つことができるメモリマップ領域の最大数を設定します。たとえば、1024000 に設定できます。

65530 未満の値は効果がありません。値が高すぎると、メモリリソースの浪費につながる可能性があります。

ネットワーク情報

パラメーター

説明

VPC 構成

このパラメーターは、[リソースタイプ][パブリックリソース] に設定されている場合にのみ使用できます。

Virtual Private Cloud (VPC) 内で DSW インスタンスを使用するには、DSW インスタンスと同じリージョンに VPC を作成し、このパラメーターを構成します。また、[VSwitch][セキュリティグループ] を構成する必要があります。さまざまなシナリオの構成ポリシーの詳細については、「ネットワーク構成」をご参照ください。

パブリックネットワークゲートウェイ

次の構成方法がサポートされています:

  • [パブリックゲートウェイ]: ネットワーク帯域幅が制限されています。ユーザーの同時実行性が高い期間や大きなファイルをダウンロードする場合、ネットワーク速度が不十分になる可能性があります。

  • [専用ゲートウェイ]: パブリックゲートウェイの帯域幅制限を解決するには、DSW インスタンスの VPC にパブリック NAT Gateway を作成し、EIP をバインドし、SNAT エントリを構成します。詳細については、「専用ゲートウェイでパブリックネットワークのアクセス速度を向上させる」をご参照ください。

次のパラメーターは、CPFS データセットがマウントされている場合にのみ使用できます:

  • [すべてのオプションを有効にする]: デフォルトでは無効になっています。システムは、CPFS データセットに接続されていない VPC を無効にします。

説明

CPFS データセットがマウントされている場合は、VPC を構成する必要があり、選択した VPC は CPFS で使用されているものと同じである必要があります。

アクセス構成

パラメーター

説明

SSH を有効にする

インスタンスへのリモート接続用です。このオプションは、VPC を選択した後にのみ使用できます。有効にすると、SSH という名前の [カスタムサービス] が表示されます。カスタムイメージを使用する場合は、sshd がインストールされていることを確認してください。

SSH 公開鍵

[SSH 構成] スイッチをオンにした後、このパラメーターを構成できます。

説明

VPC とパブリックネットワークの両方のログインをサポートするには、複数のクライアントから公開鍵を追加します。各公開鍵を新しい行に追加します。最大 10 個の公開鍵を追加できます。

カスタムサービス

SSH リモートアクセスまたはインターネット経由でインスタンス内のサービスにアクセスするために使用されます。

  • [リスナーポート]: DSW インスタンスで実行されているサービスがリッスンするポート。

  • [サービスアクセス方法]:

    • [VPC アクセス]: このアクセス方法はデフォルトでサポートされています。ECS インスタンスなど、VPC 内の他の端末から DSW のサービスにアクセスできます。

    • [パブリックネットワークアクセス]: パブリックネットワークアクセスを追加するには、このオプションを選択します。また、[NAT Gateway][Elastic IP Address] を構成する必要があります。

  • [パブリックアクセスポート]: パブリックネットワークからのアクセスを許可するポート。

VPC アクセス用のドメイン名を作成

内部権威ドメイン (PrivateZone) を作成します。VPC 内でこのドメインを使用して、インスタンスの SSH サービスまたは他のカスタムサービスにアクセスし、インスタンスの IP アドレスが変更されることによる不便を回避します。PrivateZone ドメインの作成には料金が発生します。詳細については、「Alibaba Cloud DNS プロダクトの課金」をご参照ください。

NAT Gateway

パブリックネットワークからインスタンス内のサービスにアクセスする場合、このゲートウェイはパブリックリクエスト (EIP:Port) をプライベート DSW インスタンス (プライベート IP:Port) にマッピングします。

Elastic IP Address

パブリックネットワークからインスタンス内のサービスにアクセスするためのパブリック IP アドレスを提供します。

ロールと権限

パラメーター

説明

可視性

[インスタンス所有者のみに表示] または [ワークスペース内で公開] を選択します。

インスタンス所有者

ワークスペース管理者のみがインスタンス所有者を変更できます。

[その他の構成を展開]

パラメーター

説明

インスタンス RAM ロール

RAM ロールをインスタンスに関連付けて、他のクラウドリソースへのアクセスを許可します。このメソッドは、STS からの一時的な資格情報を使用して他のクラウドリソースにアクセスするため、長期的な AccessKey の使用を回避し、キー漏洩のリスクを軽減します。
次のオプションが利用可能です:

  • [デフォルトの PAI ロール]: 内部 PAI プロダクト、MaxCompute、および OSS へのアクセス権限を持ちます。デフォルトの PAI ロールに基づいて発行された一時的なアクセス資格情報は、内部 PAI プロダクトおよび MaxCompute テーブルにアクセスする際に、DSW インスタンス所有者と同等の権限を持ちます。OSS にアクセスする場合、現在のワークスペースに構成されているデフォルトのストレージパスバケットにのみアクセスできます。

  • [カスタムロール]: カスタマイズされた、またはより詳細な権限管理のためにカスタムロールを構成します。

  • [ロールを関連付けない]: AccessKey を使用して他のクラウドプロダクトに直接アクセスする場合は、これを選択します。

インスタンス RAM ロールの構成の詳細については、「DSW インスタンスのインスタンス RAM ロールを構成する」をご参照ください。

よくある質問

DSW インスタンスの起動時によくある問題

クリックして展開

Q: DSW インスタンスの起動に失敗する

トラブルシューティング: DSW インスタンス名をクリックします。エラーメッセージは [イベント] タブに表示されます。

image

以下は一般的なエラーとその解決策です:

  • 現在、リクエストされたリソースタイプ [ecs.******] が不足しています。他のリージョンまたは他のリソースタイプを試してください

    • 原因: 選択したインスタンスタイプは、現在のリージョンで在庫が不足しているため、インスタンスを作成できません。

    • 解決策: 後でもう一度インスタンスを作成するか、別のインスタンスタイプまたはリージョンに切り替えてみてください。

  • リソース使用量がデフォルトの制限を超えました。制限を引き上げるには、チケットシステムでお問い合わせください。

    • 原因: 各 Alibaba Cloud アカウントは、各リージョンで最大 2 × GPU の DSW インスタンスを作成することに制限されています。選択したインスタンスタイプがこの制限を超えると、作成は失敗します。

    • 解決策: クォータを増やすには、チケットを送信できます。

  • 指定されたゾーンでは、このリソースの販売が一時的に停止されています。リソース不足のリスクを回避するために、マルチゾーン作成機能を使用することをお勧めします。

    解決策: リソース不足のリスクを回避するために、次の操作を試すことができます:

    • 別のリージョンに切り替えます。

    • インスタンスタイプを調整します。

    • オフピーク時にインスタンスを起動してみてください。

  • CommodityInstanceNotAvailableError: 過去の長期延滞により、商品インスタンスはリリースされました。新しいインスタンスを作成して使用してください

    • 原因: 長期間の支払い遅延のため、インスタンスはシステムによってリリースされました。

    • 解決策: 新しいインスタンスを作成できます。

  • 現在の ECI インスタンスの課金は停止されましたが、関連リソースはまだクリーンアップ中です。

    • 原因: トライアルリソースはパブリックリソースです。ピーク時に DSW インスタンスを起動すると、起動に 30 分以上かかる場合があります。システムが 1 時間以内にリソースを取得できない場合、選択したインスタンスタイプが利用できないことを示すメッセージが表示されます。

    • 解決策: 次の操作を試すことができます:

      • リージョンを切り替えます。

      • インスタンスタイプを変更します。保留中のインスタンスのインスタンスタイプは変更できません。インスタンスを停止してからインスタンスタイプを変更する必要があります。

      • 勤務時間外など、オフピーク時にインスタンスを使用します。

      • 上記の方法で問題が解決しない場合は、ビジネス マネージャーにお問い合わせください。

  • クラスターリソースは完全に利用されています。後で試すか、他のリージョンを試してください。

    • 原因: 現在の計算リソースは完全に占有されています。

    • 解決策: 次の操作を試すことができます:

      • リージョンを切り替えます。

      • インスタンスタイプを変更します。保留中のインスタンスのインスタンスタイプは変更できません。インスタンスを停止してからインスタンスタイプを変更する必要があります。

      • 勤務時間外など、オフピーク時にインスタンスを使用します。

      • 上記の方法で問題が解決しない場合は、ビジネス マネージャーにお問い合わせください。

  • 指定されたインスタンスが在庫切れのため、ECI の作成に失敗しました。在庫切れのリスクを回避するために、マルチゾーン作成機能を使用することをお勧めします。

    原因: 指定された計算リソースが在庫切れです。

    解決策: 次の操作を試すことができます:

    • リージョンを切り替えます。

    • インスタンスタイプを変更します。保留中のインスタンスのインスタンスタイプは変更できません。インスタンスを停止してからインスタンスタイプを変更する必要があります。

    • 勤務時間外など、オフピーク時にインスタンスを使用します。

    • 上記の方法で問題が解決しない場合は、ビジネス マネージャーにお問い合わせください。

  • back-off 10s restarting failed container=dsw-notebook pod

    • 原因: システムディスクがいっぱいです。システムディスクを拡張する必要があります。

      システムディスクの使用状況を表示するには:

      image

      image

    • 解決策: [構成の変更] をクリックしてシステムディスクを拡張します。

      image

      重要

      システムディスクを拡張すると、インスタンスが実行中であるかどうかに関係なく、システムディスクの課金が継続されます。DSW インスタンスのすべての課金を停止するには、インスタンスを削除する必要があります。インスタンスを削除する前に、必要なすべてのデータをバックアップしたことを確認してください。

  • vSwitch のある利用可能なゾーンが在庫切れです

    • 原因: DSW インスタンスに VPC が構成されています。VPC 内の vSwitch にはゾーンプロパティがあります。vSwitch が構成されると、計算リソースの検索は vSwitch があるゾーンに限定され、リソース不足を引き起こす可能性があります。

    • 解決策: DSW インスタンスの構成を変更し、VPC を空に設定できます。

      image

      説明

      VPC を使用する場合は、別のゾーンに切り替えて新しい vSwitch と DSW インスタンスを作成することをお勧めします。これにより、利用可能なリソースの範囲が広がり、リソース範囲が限定されることによる不足を防ぐことができます。

  • 「ワークスペースメンバーが見つかりません」というメッセージで起動に失敗しました

    解決策: ワークスペース管理者に連絡して、アカウントをワークスペースのメンバーとして追加してもらいます。

  • containerd コンテナーの作成に失敗しました: アーカイブからのレイヤーの準備に失敗しました: アーカイブクォータの検証に失敗しました ...

    • 原因: インスタンスイメージに対して利用可能なディスク容量が不足しています。

    • 解決策: インスタンス詳細ページに移動し、システムディスクをスケールアウトします。システムディスクをスケールアウトすると、その容量に基づいて追加料金が発生することに注意してください。

      image

その他の起動失敗の理由:

  • 支払い遅延による作成失敗

    アカウントに支払い遅延がある場合、DSW インスタンスを作成できません。バウチャーは支払い遅延の相殺には使用できません。ユーザーセンターにログインして、アカウントに支払い遅延があるかどうかを確認できます。

Q: DSW インスタンスの起動時に Python ファイルを実行できますか?

はい、DSW インスタンスを作成するか、インスタンス構成を変更するときに [カスタム起動スクリプト] を設定できます。

image

この機能を使用して、インスタンスの起動時に環境をカスタマイズしたり、初期化タスクを実行したりできます。カスタムスクリプトは、イメージとリソースの準備ができた後、JupyterLab や Code Server などの開発者アプリケーションが起動する前に実行されます。

説明
  • カスタムスクリプトはインスタンスの起動時間を増加させ、3 分のタイムアウトがあります。スクリプトがタイムアウトしないように、大きなファイルやイメージのダウンロードなどの長時間実行タスクをカスタムスクリプトで実行しないでください。

  • インスタンスの起動後、/var/log/user-command/ パスでカスタムスクリプトによって生成されたログを見つけることができます。

Q: DSW インスタンスが見つかりませんか?

概要ページでは、異なるリージョンで作成されたさまざまなタイプのインスタンスを表示できます。リージョンを切り替えてインスタンスを見つけてみてください。

image

Q: DSW ページが異常または応答しない場合はどうすればよいですか?

空白のページ、読み込みが続く Notebook、コマンドを受け付けない Terminal などの問題は、通常、ローカル環境に関連しています。次のトラブルシューティング手順を試してください:

  1. ブラウザのキャッシュをクリアして、もう一度試してください。

  2. ブラウザのシークレットモードまたはプライベートモードを使用してページにアクセスします。

  3. ネットワーク環境を変更します。たとえば、会社の内部ネットワークからモバイルホットスポットに切り替えて、ファイアウォールの制限を確認します。

  4. Chrome や Firefox など、別のブラウザを使用してみてください。

Q: ディスクをシステムディスクとして使用する DSW インスタンスが停止、再起動、インスタンスタイプの変更、またはイメージの置き換えが行われた場合、システムディスク上のデータは失われますか?

クラウドディスクをシステムディスクとして使用する DSW インスタンスには、パブリックリソースグループで作成されたインスタンスと、システムディスクとして [ディスク] を選択した汎用リソースインスタンスが含まれます。これらのインスタンスのシステムディスク上のデータは、次のように影響を受けます:

  • インスタンスの停止: データが失われる可能性があります。ディスクが拡張されておらず、インスタンスが 15 日以上停止したままである場合、データは削除され、回復できません。ディスクが拡張されているか、インスタンスが 15 日以下停止している場合、データは失われません。

  • インスタンスの再起動: データは失われません。インスタンスが停止または再起動された後、pip を使用してインストールされたすべてのパッケージ、コードファイル、およびシステムディスク上のその他のデータは保持されます。

  • インスタンスタイプの変更: データは失われません。CPU、メモリ、GPU 構成などのインスタンスタイプを調整しても、システムディスク上のデータには影響しません。

  • イメージの置き換え: 一部のデータが失われる可能性があります。イメージを変更しても、マウントされたデータセットや OSS のデータには影響しません。ただし、システムディスク上のコンテンツはリセットされる可能性があります。したがって、イメージを変更する前にインスタンスデータを保存してください。たとえば、データをデータセットや OSS にコピーまたは移動できます。詳細については、「データセット、OSS、NAS、または CPFS をマウントする」をご参照ください。

システムディスクとして [一時ストレージ] を使用する汎用リソースインスタンスの場合、AI リソースグループがサブスクリプションディスクで構成されているかどうかに関係なく、インスタンスが停止、再起動、または仕様やイメージが変更されると、システムディスク上のすべてのデータが失われます。

Q: パブリックリソースを使用して作成された DSW インスタンスは、15 日以上ログインしなかった後にリリースされた場合、回復できますか?

パブリックリソースで作成された DSW インスタンスの場合、クラウドディスクシステムディスクが拡張されておらず、インスタンスが 15 日間以上連続して起動されていない場合、そのシステムディスクは自動的にクリアされ、回復できません。

DSW インスタンスの停止またはリリースに関する一般的な問題

クリックして展開

Q: DSW インスタンスをリリースするにはどうすればよいですか?

DSW インスタンスリストページで、インスタンスの [停止] または [削除] をクリックします。

image

注: DSW インスタンスを作成する際にシステムディスクを拡張した場合、インスタンスが実行中であるかどうかに関係なく、システムディスクの課金は継続されます。DSW インスタンスのすべての課金を停止するには、インスタンスを削除する必要があります。

Q: DSW インスタンスが見つからないのはなぜですか?

インスタンスが見つからない場合は、別のリージョンとワークスペースに切り替えてみてください。

image

Q: 無料トライアルリソースプランをリリースするにはどうすればよいですか?

無料トライアルリソースプランは、リリースまたは停止する必要はありません。

Q: DSW インスタンスの課金を完全に停止するにはどうすればよいですか?「停止」と「削除」の違いは何ですか?

  • インスタンスの停止: この操作は、インスタンスの計算リソース (CPU/GPU) を解放し、計算の課金を一時停止します。: 拡張されたシステムディスクは引き続き課金されます。

  • インスタンスの削除: この操作は、システムディスクを含むインスタンスとそのすべてのリソースを完全に削除します。関連するすべての課金が停止します。

選択方法:

  • 停止: 一時的にインスタンスを必要としないが、将来の使用のためにデータと環境を保持したい場合に使用します。

  • 削除: インスタンスが不要になり、すべての課金を停止したい場合に使用します。この操作を実行する前に、データをバックアップする必要があります。

Q: DSW インスタンスが「停止中」または「削除中」の状態でスタックし、操作が完了できないのはなぜですか?

システムがタスクを安全に終了し、状態を保存し、リソースを回収する必要があるため、インスタンスの停止または削除には時間がかかります。インスタンスが長時間応答しない場合、一般的な理由は次のとおりです:

  • インスタンスに正常に終了していないプロセスがあります。

  • メモリ使用率が高いため、インスタンスがシャットダウンコマンドに応答できません。

この状況では、しばらく待ってからページを更新してください。インスタンスのステータスが [停止] に変わるはずです。

Q: DSW インスタンスを停止または削除した後、データとコードは失われますか?

データが保持されるかどうかは、操作とインスタンスのリソースグループタイプによって異なります。

  • インスタンスの停止:

    データ保持ポリシーは、リソースグループタイプによって異なります。

    • ほとんどの従量課金および汎用インスタンスで、クラウド [ディスク] をシステムディスクとして使用する場合、ディスクが拡張されておらず、インスタンスが 15 日以上停止している場合、データは削除され、回復できません。ディスクが拡張されているか、インスタンスが 15 日以下停止している場合、データは保持されます。

    • システムディスクとして一時ストレージを使用するインスタンス: データは一時ストレージに保存されます。インスタンスを停止するとデータは削除され、回復できません。

  • インスタンスの削除:

    システムディスク上のすべてのデータは完全に消去され、回復できません。したがって、削除する前にすべての重要なデータをバックアップする必要があります。

Q: 実行中の DSW インスタンスが自動的に停止するのはなぜですか?

インスタンスには、アイドル時の自動シャットダウンポリシーが構成されています。このポリシーはリソースを節約するために設計されており、無料トライアルインスタンスではデフォルトで有効になっています。

  • トリガー条件: インスタンスの CPU と GPU の使用率が、設定されたしきい値を 3 時間連続して下回る。

  • 推奨されるアクション:

    • 手動停止: リソースの節約を確実にするために、使用していないときはインスタンスを手動で停止します。自動シャットダウンポリシーが毎回トリガーされるとは限りません。

    • ポリシーの変更: 長期的なタスクを実行するには、このポリシーを変更または無効にすることができます。手順は次のとおりです:

      DSW 自動シャットダウンポリシーの変更

      1. ワークスペース詳細ページに移動し、[ワークスペース構成] > [スケジューリング構成] をクリックします。

        image

      2. DSW 構成エリアを見つけ、DSW シャットダウンポリシーと除外ポリシーを変更できます。

        image

Q: すべての DSW インスタンスを停止または削除しましたが、なぜまだ「実行中」と表示されたり、請求通知が届いたりするのですか?

次の一般的な理由を確認してください:

  • リソースプランとインスタンスを混同している。表示されている「実行中」のステータスは、インスタンスではなくリソースプラン (「月間 250 課金時間」など) を指している可能性があります。リソースプランは有効期間内は常にアクティブであり、そのステータスはインスタンスとは無関係です。

  • 拡張されたシステムディスクはまだ課金されています。インスタンスを停止すると、コンピューティング料金のみが一時停止されます。拡張されたシステムディスクは、ストレージ料金が発生し続けます。

  • 課金に遅延があります。課金はリアルタイムではありません。リソースを使用してから数時間後に請求書が生成される場合があります。たとえば、午前中に発生した料金は、午後まで請求書に表示されない場合があります。