すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:中国語テキストのタイトルを生成する

最終更新日:Nov 19, 2024

モデルギャラリーは、中国語テキストのタイトルを生成するために使用できるeasynlp_pai_mt5_title_generation_zhモデルを提供します。 モデルを直接デプロイできます。 独自のデータセットを使用して、特定のシナリオに合わせてモデルを微調整することもできます。 このトピックでは、モデルギャラリーにeasynlp_pai_mt5_title_generation_zhモデルを展開して中国語テキストのタイトルを生成する方法について説明します。

前提条件

Object Storage Service (OSS) バケットが作成されます。 詳細については、「バケットの作成」をご参照ください。

モデルの詳細ページに移動

  1. モデルギャラリーページに移動します。

    1. PAI コンソールにログインします。

    2. 左側のナビゲーションペインで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースを見つけ、ワークスペースの名前をクリックします。 ワークスペースの詳細ページが表示されます。

    3. [ワークスペースの詳細] ページの左側のナビゲーションウィンドウで、[モデルギャラリー] をクリックします。

  2. モデルギャラリーページで、NLPセクションのテキスト生成をクリックします。 右側のモデルリストで、easynlp_pai_mt5_title_generation_zhモデルを見つけてクリックし、モデルの詳細ページに移動します。

    image

モデルの直接デプロイとデバッグ

モデルをモデルサービスとして展開

  1. モデルの詳細ページで、右上隅の [デプロイ] をクリックします。

  2. [デプロイ] パネルで設定を確認し、[デプロイ] をクリックします。

  3. [課金通知] メッセージで、[OK] をクリックします。

    サービスの詳細ページが表示されます。 [サービスの詳細] タブで、[基本情報] セクションでサービスのステータスを表示できます。 [ステータス] パラメーターの値が [稼働中] に変わると、モデルサービスがデプロイされます。

モードをオンラインでデバッグ

PAIコンソールでモードをオンラインでデバッグする

  1. [サービスの詳細] タブで、[オンライン予測] フィールドにリクエストデータを入力します。 サンプル要求データ:

    {
        "data": ["在广州第一人民医院,一个上午6名患者做支气管镜检查,5人查出肺癌,且4人是老烟民! 专家称,吸烟和被动吸烟是肺癌的主要元凶。"]
    }

    image

  2. [リクエストの送信] をクリックします。

    ページの下部で応答を表示できます。image

Pythonコードを実行してモードをオンラインでデバッグする

  1. サービスの呼び出し情報を表示します。

    1. [サービスの詳細] タブの [リソース情報] セクションで、[通話情報の表示] をクリックします。

      image

    2. [呼び出し情報] ダイアログボックスで、[パブリックネットワークアドレス呼び出し] タブの [アクセスアドレス][トークン] パラメーターを表示し、パラメーターの値を記録します。

  2. 次のサンプルコードを実行して、サービスを呼び出すリクエストを送信します。

    import requests
    
    url = "<PredictionServiceEndpoint>"
    token = "<PredictionServiceAccessToken>"
    request_body = '{"data": ["在广州第一人民医院,一个上午6名患者做支气管镜检查,5人查出肺癌,且4人是老烟民! 专家称,吸烟和被动吸烟是肺癌的主要元凶。"]}'
    request_body = request_body.encode('utf-8')
    headers = {"Authorization": token}
    resp = requests.post(url=url, headers=headers, data=request_body)
    
    print(resp.content.decode())
    print("status code:", resp.status_code)
    

    上記のコードのurlおよびtokenを、上記の手順で取得したAccess addressおよびTokenパラメーターの値に置き換えます。

    次の図に、返される結果を示します。

    p670902.png

微調整モデル

  1. 必要に応じて、 データセットを準備します。

    説明

    独自のデータを使用してモデルを微調整するには、次の手順を実行してトレーニングデータセットを準備します。

    1. モデルギャラリーは、モデルの微調整用のデフォルトデータセットを提供します。 デフォルトのデータセットを使用するか、独自のデータセットを準備できます。 トレーニングデータセットを次の形式で準備します。

      {"text": "<text>", "summary": "summary"}
      {"text": "<text>", "summary": "summary"}
      {"text": "<text>", "summary": "summary"}
      ......
      {"text": "<text>", "summary": "summary"}
      
    2. 準備したデータセットをOSSバケットにアップロードします。 詳細については、「オブジェクトのアップロード」をご参照ください。

  2. トレーニングジョブを送信します。

    1. モデルの詳細ページに戻ります。 詳細については、このトピックの「モデルの詳細ページに移動」をご参照ください。

    2. 右上隅の [微調整] をクリックします。 [微調整] パネルで、[ジョブ設定] セクションの [出力パス] パラメーターをOSSバケットのパスに設定し、[微調整] をクリックします。 この例では、デフォルトのデータセットがモデルの微調整に使用されます。

      説明

      トレーニングデータセットを準備した場合は、[微調整] パネルでトレーニングデータセットを指定し、[微調整] をクリックします。 詳細については、「モデルのデプロイとトレーニング」トピックの「モデルのデプロイとトレーニング」セクションを参照してください。

      ジョブの詳細ページが表示されます。 [タスクログ] タブをクリックして、トレーニングプロセスを表示できます。image.png

微調整されたモデルのデプロイとデバッグ

  1. トレーニング済みモデルは、AIアセット管理 > モデルに自動的に登録されます。 モデルを表示またはデプロイできます。 詳細については、「モデルの登録と管理」をご参照ください。

  2. モデルをオンラインでデバッグします。 詳細については、このトピックの「モデルをオンラインでデバッグする」をご参照ください。