すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:データのインポート

最終更新日:Dec 25, 2025

ナレッジベースを構築する前に、ナレッジデータを Alibaba Cloud Model Studio にインポートする必要があります。このデータは、ナレッジベースの初期ソースとして機能します。

重要

ユーザーガイド

ローカルファイルのインポート

  1. ファイルタブに移動します。

  2. 左側の [カテゴリ管理] セクションで、既存のカテゴリを選択するか、image アイコンをクリックして作成します。

    Alibaba Cloud Model Studio は、カテゴリを使用してインポートされたファイルを管理します。
  3. [データのインポート] をクリックします。[データのインポート] ページで、インポート方法を [ローカルファイルのアップロード] に設定します。

    現在、プラットフォームは JSON、CSV、または YAML ファイルの直接インポートをサポートしていません。これらのファイルをインポートする前に、XLSX または XLS 形式に変換する必要があります。
  4. [解析方法][デフォルト設定]または[カスタム設定]から選択します。[カスタム設定]を選択した場合、特定のフォーマットの解析ルールを設定してパフォーマンスを向上させることができます。

    解析方法

    要件に応じて解析ポリシーを設定できます。不明な場合は、デフォルト設定を維持できます。

    • デジタル解析: ファイル内の図またはチャートを解析しません。

    • インテリジェント解析: ファイル内の図については、パーサが画像からテキストを検出して抽出し、テキストの要約を生成します。これらの要約は、他の画像以外のコンテンツとともにチャンク化され、ベクターに変換され、ナレッジベースの取得に使用されます。

    • LLM Parsing: Qwen-VL モデルを使用するエージェントアプリケーションは、ファイル内のイラストやチャートに関する質問に回答できます。モデルがこのコンテンツを検出して理解できるようにするには、[LLM Parsing] を選択します。

    • Qwen VL Parsing: イメージフォーマットにのみ対応しています。 Qwen-VL モデルを選択し、プロンプトを使用して、モデルが検出するレイアウト、要素、コンテンツを指定できます。 その他の特徴は LLM Parsing と同じです。

    image

    image

    Alibaba Cloud Model Studio アプリケーションがファイルからの図を回答に正しく表示させる方法

  5. (任意) ファイルの[タグの設定]を行います。

    API を使用してアプリケーションを呼び出す際、tags リクエストパラメーターでタグを指定できます。アプリケーションは、ナレッジベースから情報を取得する際にこれらのタグで関連ファイルをフィルター処理し、取得効率を向上させます。エージェントアプリケーションの場合、コンソールでナレッジベースをデバッグする際にタグを設定できます。
  6. [確認] をクリックして、データの解析とインポートを開始します。ページでタスクの進捗を確認できます。

    ファイルは Model Studio が処理できるフォーマットに変換されます。このプロセスは、ビジネスのピーク時には数時間かかる場合があります。プロセスが完了するまでお待ちください。
  7. インポートが完了したら、ファイルの横にある[詳細]をクリックして表示します。

    ファイルが Model Studio にインポートされると、プラットフォームが提供する無料のストレージスペースに独立したレプリカとして保存されます。このレプリカは元の生データとは関連付けられておらず、容量制限もありません。
    過去 90 日以内にインポートされたファイルのみ表示できます。この期間を過ぎると、インポートされたファイルは表示できませんが、削除はされません。
    インポートされたファイルは、現在のワークスペースのユーザーのみが使用できます。Model Studio は、これらを商業目的で使用したり、公開したりすることはありません。

ローカルテーブルのインポート

  1. テーブルタブに移動します。

  2. 左側の [テーブル管理] セクションで、既存のデータテーブルを選択するか、image アイコンをクリックして新規作成します。

    Alibaba Cloud Model Studio は、データテーブルを使用してインポートされたデータを管理します。

    新しいデータテーブルへのインポート

    1. [テーブル名] を入力します。次に、[Excel ファイルをアップロード] または [カスタムヘッダー] を使用してテーブルスキーマを設定します。

      • Excel のアップロード:Model Studio は、アップロードされたファイル内のテーブルヘッダーを自動的に検出し、そのヘッダーを使用してデータテーブルスキーマを作成し、残りのコンテンツをデータレコードとしてテーブルにインポートします。

      • カスタムヘッダー: [列名][タイプ] フィールドは必須です。[説明] フィールドは任意です。

        重要
        • データテーブルの構造 (列名、説明、タイプを含む) は、確定後に変更することはできません。

        • アップロードファイルのスキーマ (列数と列名を含む) は、ターゲットのデータテーブルのスキーマと完全に一致する必要があります。一致しない場合、インポートは失敗します。たとえば、インポートするデータテーブルに 2 つの列がある場合、テーブルスキーマに同一の列名を持つ 2 つのフィールドを設定する必要があります。[操作] 列の [列の追加] または [削除] をクリックして、フィールドを追加または削除できます。

        • モデルが各フィールドの意味を理解しやすくするために、[**説明**] フィールドに明確で自然な言語で説明を入力してください。たとえば、age フィールドがユーザーの年齢を表すことを指定できます。

        • フィールドタイプを image_url に設定した場合、値が一般にアクセス可能な画像 URL であることを確認してください。ナレッジベースは、この URL から画像を取得してベクターインデックスを生成し、画像による検索などのシナリオで使用します。

          image_url 形式の例:https://example.com/downloads/pic.jpg
          ナレッジベースを作成する際、image_url タイプのフィールドはイメージインデックスの生成に使用されます。Model Studio はターゲット画像にアクセスし、その特徴を抽出し、イメージエンベディングを使用して特徴をベクターに変換し、そのベクターを保存します。ナレッジベースの取得中に、このベクターはユーザーがアップロードした画像のベクターと類似性について比較されます。
    2. image アイコンをクリックして、ファイル (XLSX または XLS 形式) を選択してアップロードします。

      ファイルにはテーブルヘッダーが含まれている必要があります。含まれていない場合、インポートは失敗します。
      現在、プラットフォームは JSON、CSV、または YAML ファイルの直接インポートをサポートしていません。これらのファイルをインポートする前に、XLSX または XLS 形式に変換する必要があります。
    3. [OK] をクリックしてインポートを開始すると、新しいデータテーブルが左側の [テーブル管理] ナビゲーションツリーに表示されます。

    既存のデータテーブルへのインポート

    1. 左側の[テーブル管理] リストからデータテーブルを選択し、[データのインポート] をクリックします。

    2. インポートタイプを[アップロードと上書き] または [増分アップロード] に設定します。

      [テンプレートのダウンロード] をクリックすると、テーブルヘッダーのみを含む空のファイルがダウンロードされます。このファイルに新しいデータを挿入し、上書きまたは増分アップロードに使用できます。
    3. image アイコンをクリックして、ファイル (XLSX または XLS 形式) を選択してアップロードします。

      ファイルには、現在のデータテーブルのヘッダー構造と一致するテーブルヘッダーが含まれている必要があります。一致しない場合、インポートは失敗します。
      現在、プラットフォームは JSON、CSV、または YAML ファイルの直接インポートをサポートしていません。これらのファイルをインポートする前に、XLSX または XLS 形式に変換する必要があります。

OSS ファイルのインポート

  1. ファイルタブに移動します。

  2. 左側の[カテゴリ管理]セクションで、既存のカテゴリを選択するか、image アイコンをクリックして新規作成できます。

    Alibaba Cloud Model Studio は、インポートされたファイルをカテゴリに整理します。
  3. [データインポート] をクリックして、[データインポート] ページを開きます。インポートメソッドを [OSS] に設定します。

    Object Storage Service (OSS) から Alibaba Cloud Model Studio に初めてデータをインポートする場合、プロンプトに従って権限付与を完了し、ターゲットバケットに bailian-datahub-access タグを追加する必要があります。詳細については、「OSS からのファイルインポートの設定」をご参照ください。
    アーカイブ、コールドアーカイブ、またはディープコールドアーカイブストレージクラスのバケットはサポートされていません。
    バケットのルートディレクトリにあるファイルへのアクセスはサポートされていません。Model Studio がアクセスするために、既存のサブディレクトリを選択するか、新しいサブディレクトリを作成してください。
    コンテンツ暗号化が有効なバケットはサポートされています。プライベートバケットもサポートされています。
    Referer ホットリンク保護が有効になっているバケットを使用する場合は、ドメイン名 *.console.aliyun.com を Referer ホワイトリストに追加する必要があります。詳細については、「信頼できるウェブサイトからのアクセスのみを許可する
  4. [デフォルト設定] または [カスタム設定] から [解析方法] を選択します。[カスタム設定] を選択すると、特定のフォーマットの解析ルールを設定してパフォーマンスを向上させることができます。

    解析方法

    要件に応じて解析ポリシーを設定します。不明な場合は、デフォルト設定のままにしておくことができます。

    • [デジタル解析] は、ファイル内のイラストやチャートの解析に対応していません。

    • インテリジェントパーシングファイル内の図について、パーサはイメージからテキストを検出・抽出し、テキストの要約を生成します。これらの要約は、イメージ以外の他のコンテンツとともにチャンク化され、ベクターに変換され、ナレッジベースの取得に使用されます。

    • LLM 解析: Qwen-VL モデルを使用するエージェントアプリケーションは、ファイル内の図やチャートに関する質問に回答できます。モデルがこのビジュアルコンテンツを検出して理解できるようにするには、[LLM 解析] を選択します。

    • Qwen VL Parsing: イメージフォーマットのみに対応しています。 Qwen-VL モデルを選択し、プロンプトを使用してモデルが検出するレイアウト、要素、コンテンツを指定できます。 その他の特徴は LLM Parsing と同じです。

    image

    image

    Model Studio アプリケーションがファイルからの図を回答に表示させる方法

  5. (任意) ファイルの[タグの設定]を行います。

    API を使用してアプリケーションを呼び出す際、tags リクエストパラメーターでタグを指定できます。アプリケーションは、ナレッジベースから情報を取得する際にこれらのタグで関連ファイルをフィルター処理し、取得効率を向上させます。エージェントアプリケーションの場合、コンソールでナレッジベースをデバッグする際にタグを設定できます。
  6. [OK] をクリックします。システムがデータの解析とインポートを開始します。ページでタスクの進捗をモニターできます。

    ファイルは Model Studio が処理できるフォーマットに変換されます。このプロセスは、ビジネスのピーク時には数時間かかる場合があります。プロセスが完了するまでお待ちください。
  7. インポートが完了したら、ファイルの横にある[詳細]をクリックして、結果を表示します。

    ファイルが Model Studio にインポートされると、プラットフォームが提供する無料のストレージスペースに独立したレプリカとして保存されます。このレプリカは元の生データとは関連付けられておらず、容量制限もありません。
    インポートされたファイルは、現在のワークスペースのユーザーのみが使用できます。Model Studio は、これらを商業目的で使用したり、公開したりすることはありません。

次のステップ

ナレッジベースの作成

詳細情報

OSS からのファイルインポートの設定

OSS から初めてファイルをインポートする場合、Model Studio に OSS リソースへのアクセス権を付与する必要があります。権限付与のプロセスは、Alibaba Cloud アカウントと RAM ユーザーで異なります。

Alibaba Cloud アカウントの権限付与

  1. 次の図に示すように、[今すぐ承認] をクリックします。

    image

  2. 表示されるダイアログボックスで、[承認の確認] をクリックします。これにより、Alibaba Cloud Model Studio に OSS リソースへのアクセスを付与する OSS サービスリンクロール が自動的に作成されます。

    権限付与は通常数秒で有効になりますが、ピーク時にはわずかな遅延が発生する場合があります。
    「このリクエストは失敗しました。再送信するか、管理者に連絡してください。エラーコード:10041495」というエラーが表示された場合の対処法

    image

  3. ターゲットの OSS バケットに bailian-datahub-access タグを追加します。

    このタグは、Model Studio がアクセスできるバケットをマークします。このタグがないバケットには Model Studio はアクセスできません。
    1. OSS コンソールにログインします。 左側のナビゲーションウィンドウで、[バケット] をクリックします。 次に、目的のバケットを見つけます。

    2. その image アイコンにカーソルを合わせ、[編集]をクリックします。

    3. 「バケットタグ」ページで、タグが設定されていない場合は [タグの作成] をクリックします。それ以外の場合は [設定] をクリックします。

    4. [タグ] をクリックし、タグキーを bailian-datahub-access に、タグ値を read に設定して、[保存] をクリックします。

      image

  4. [データのインポート] ページに戻り、ターゲットバケットを再選択して、インポートをリトライしてください。

    Model Studio はバケットのルートディレクトリにあるファイルへのアクセスをサポートしていないことに注意してください。Model Studio がアクセスするために、既存のサブディレクトリを選択するか、新しいサブディレクトリを作成してください。

RAM ユーザーの権限付与

  1. 次の図に示すように、[今すぐ承認] をクリックします。

    image

  2. ダイアログボックスで、[承認の確認] をクリックします。[承認失敗] または [権限なし] というエラーが表示された場合は、まず RAM ユーザーにサービスリンクロールを作成する権限を付与する必要があります。

    1. RAM コンソールにログインします。 左側のナビゲーションウィンドウで、権限 > ポリシーを選択し、[ポリシーの作成]をクリックします。

    2. [JSON] タブをクリックし、次のポリシーをコピーして貼り付け、[OK] をクリックします。

      {
          "Action": [
              "ram:CreateServiceLinkedRole"
          ],
          "Resource": "*",
          "Effect": "Allow",
          "Condition": {
              "StringEquals": {
                  "ram:ServiceName": "datahub.sfm.aliyuncs.com"
              }
          }
      }

      image

    3. ポリシー名を入力し、[OK] をクリックします。

      image

    4. 左側のナビゲーションウィンドウで、[ID] > [ユーザー] を選択します。 ページで、権限を付与する RAM ユーザーを探し、[操作] 列で [権限の追加] をクリックします。

    5. アクセスポリシーリストで、作成したカスタムポリシーを選択し、[権限を付与] をクリックします。RAM ユーザーはサービスリンクロールを作成する権限を持つようになります。

      image

  3. RAM ユーザーに Model Studio を介して OSS にアクセスする権限を付与します。

    1. [データインポート] ページに戻り、[今すぐ承認] をクリックします。

      image

    2. 表示されるダイアログボックスで、[承認の確認] をクリックすると、必要な OSS サービスリンクロール が自動的に作成されます。

      権限付与は通常数秒で有効になりますが、ピーク時にはわずかな遅延が発生する場合があります。
      「リクエストに失敗しました。再送信するか、管理者に連絡してください。エラーコード:10041495」というエラーが発生した場合の対処法

      image

  4. ターゲットの OSS バケットに bailian-datahub-access タグを追加します。

    このタグは、Model Studio がアクセスできるバケットをマークします。このタグがないバケットには Model Studio はアクセスできません。
    1. OSS コンソールにログインします。左側のナビゲーションウィンドウで、[バケット] をクリックします。次に、目的のバケットを見つけます。

    2. image アイコンにカーソルを合わせ、[編集] をクリックします。

    3. Bucket Tag ページで、タグが設定されていない場合は[タグの作成]をクリックします。それ以外の場合は[設定]をクリックします。

    4. [タグ] をクリックし、タグキーを bailian-datahub-access に、タグ値を read に設定し、次に [保存] をクリックします。

      image

  5. [データのインポート] ページに戻り、ターゲットバケットを再選択して、インポートをリトライしてください。

    Model Studio はバケットのルートディレクトリにあるファイルへのアクセスをサポートしていないことに注意してください。Model Studio がアクセスするために、既存のサブディレクトリを選択するか、新しいサブディレクトリを作成してください。

クォータと制限

サポートされているデータ形式と容量の詳細については、「ナレッジベースのクォータと制限」をご参照ください。

よくある質問

権限とセキュリティ

  • データをインポートする際に、「このモジュールにアクセスする権限がありません」というエラーメッセージが表示されます。どうすればよいですか?

    デフォルトでは、RAM ユーザーはデータのインポートやナレッジベースの作成などの書き込み操作を実行できません。これらの操作を有効にするには、Alibaba Cloud アカウントが RAM ユーザーに管理者ページ権限、または少なくとも アプリケーションデータ - 操作ナレッジベース - 操作 を含む権限を付与する必要があります。

OSS ファイルのインポート

  • エラーコード「10041495」が返された場合はどうすればよいですか?

    このエラーは通常、Alibaba Cloud アカウントが OSS を有効化していないために発生します。この問題を解決するには、次の手順を実行します:

    1. Alibaba Cloud アカウントを使用してOSS コンソールにログインし、プロンプトに従って OSS を有効化します。

    2. Model Studio の[データのインポート] ページに戻り、権限付与をリトライします。