テキストモデレーション 2.0 は、多言語モデル機能を強化しています。より多くの言語をサポートし、言語を自動的に識別できます。グローバルビジネスの特性を考慮し、テキストモデレーション 2.0 は個別のモデレーションポリシーと個別の国際化ラベル付けシステムを採用しています。このトピックでは、テキストモデレーション 2.0 が提供する多言語サービスの詳細と使用方法について説明します。
機能紹介
テキストモデレーション 1.0 の多言語サービスと比較して、テキストモデレーション 2.0 は、グローバルビジネスの要件を満たすために、個別のモデレーションポリシーと個別の国際化ラベル付けシステムを利用しています。さらに、サービスの利用を簡素化し、手動レビューを支援するためのより多くの機能を提供します。
比較項目 | テキストモデレーション 2.0 | テキストモデレーション 1.0 |
多言語機能 | 38 言語をサポートします。 | 18 言語をサポートします。 |
モデレーション機能 | 複数のモデルを利用し、言語と地域の特性を組み込んでいます。モデレーションポリシーはより正確です。 | 単一のモデルを利用し、言語特性を組み込んでいます。モデレーションポリシーは、精度と再現率を考慮しています。 |
ラベル付けシステム | グローバルビジネス向けに個別の国際化ラベル付けシステムを利用し、冒涜や地域などの国際化ラベルを追加し、複数のリスクラベルとサブカテゴリラベルをサポートします。 | 以前のバージョンのラベル付けシステムを継承し、テキストモデレーションタスクに対して単一の単一リスクラベルのみをサポートします。 |
操作 | 入力言語を指定する必要はなく、テキストモデレーション 2.0 はそれを自動的に識別できます。モデレーションが完了すると、言語タイプと翻訳された英語コンテンツが返され、手動レビューを支援します。 | 入力言語を指定する必要があります。翻訳は返されません。 |
サポートされている言語
テキストモデレーション 2.0 の多言語サービスは、38 言語をサポートしています。
言語タイプ | 名前 | 言語コード |
英語 | 英語 | en |
簡体字中国語 | 中国語 | zh |
繁体字中国語 | 繁体字中国語 | zh-tw |
インドネシア語 | インドネシア語 | id |
マレー語 | マレー語 | ms |
タイ語 | タイ語 | th |
ベトナム語 | ベトナム語 | vi |
タガログ語 | タガログ語 | tl |
ヒンディー語 | ヒンディー語 | hi |
アラビア語 | アラビア語 | ar |
トルコ語 | トルコ語 | tr |
フランス語 | フランス語 | fr |
ドイツ語 | ドイツ語 | de |
ロシア語 | ロシア語 | ru |
ポルトガル語 | ポルトガル語 | pt |
スペイン語 | スペイン語 | es |
イタリア語 | イタリア語 | it |
オランダ語 | オランダ語 | nl |
ポーランド語 | ポーランド語 | pl |
日本語 | 日本語 | ja |
韓国語 | 韓国語 | ko |
ウルドゥー語 | ウルドゥー語 | ur |
ウイグル語 | ウイグル語 | ug |
ベンガル語 | ベンガル語 | bn |
ペルシア語 | ペルシア語 | fa |
スウェーデン語 | スウェーデン語 | sv |
デンマーク語 | デンマーク語 | da |
ノルウェー語 | ノルウェー語 | no |
アイスランド語 | アイスランド語 | is |
フィンランド語 | フィンランド語 | fi |
ベラルーシ語 | ベラルーシ語 | be |
リトアニア語 | リトアニア語 | lt |
チェコ語 | チェコ語 | cs |
スロバキア語 | スロバキア語 | sk |
ハンガリー語 | ハンガリー語 | hu |
ギリシャ語 | 現代ギリシャ語 | el |
ルーマニア語 | ルーマニア語 | ro |
アイルランド語 | アイルランド語 | ga |
国際化ラベル
テキストモデレーション 2.0 の多言語サービスは、国際化ラベル付けシステムを採用しています。コンテンツに複数の種類のリスクが含まれている場合、複数のラベルが同時に返される可能性があります。ラベルカテゴリには、次の表にリストされているものが含まれますが、これらに限定されません。
ラベルタイプ | カテゴリ |
レベル 1 ラベル |
|
サブカテゴリラベル (riskTips) |
|
課金方法
テキストモデレーション 2.0 は、従量課金課金方法をサポートしています。
従量課金
テキストモデレーション 2.0 サービスを有効にすると、デフォルトの課金方法は従量課金になります。日額料金は実際の使用量に基づいて計算されます。サービスが呼び出されない場合、料金は発生しません。
モデレーションタイプ | サポートされているビジネスシナリオ (サービス) | 単価 |
高度なテキストモデレーション (text_advanced) | 国際ビジネスシナリオでの多言語モデレーション:comment_multilingual_global | 1,000 回呼び出しあたり 0.3 USD |
テキストモデレーション 2.0 サービスの使用
ステップ 1:テキストモデレーション 2.0 を有効にする
サービスの有効化ページを開き、テキストモデレーション 2.0 サービスを有効にします。
テキストモデレーション 2.0 サービスを有効にすると、デフォルトの課金方法は従量課金になります。日額料金は実際の使用量に基づいて決済されます。サービスが呼び出されない場合、料金は発生しません。API オペレーションを呼び出すと、課金システムは使用量に基づいて自動的に課金します。詳細については、課金ルールをご参照ください。
ステップ 2:RAM ユーザーに権限を付与する
Resource Access Management (RAM) ユーザーとして API オペレーションを呼び出したり、SDK を使用したりする前に、RAM ユーザーに権限を付与する必要があります。Alibaba Cloud アカウントと RAM ユーザーの AccessKey ペアを作成できます。API オペレーションを呼び出すときは、AccessKey ペアを使用して ID 検証を完了する必要があります。AccessKey ペアの取得方法については、AccessKey ペアの作成をご参照ください。
RAM 管理者として RAM コンソール にログオンします。
RAM ユーザーを作成します。
詳細については、RAM ユーザーの作成をご参照ください。
AliyunYundunGreenWebFullAccessシステムポリシーを RAM ユーザーに付与します。詳細については、RAM ユーザーへの権限の付与をご参照ください。
上記の操作を完了すると、RAM ユーザーとしてコンテンツモデレーション API を呼び出すことができます。
ステップ 3:SDK のインストールと使用
次の表に、サポートされているリージョンを示します。API操作の詳細については、「テキストモデレーション 2.0 サービス」の「テキストモデレーション 2.0 SDK と使用ガイド」をご参照ください。
リージョン | パブリックエンドポイント | インターナルエンドポイント |
シンガポール | green-cip.ap-southeast-1.aliyuncs.com | green-cip-vpc.ap-southeast-1.aliyuncs.com |
米国 (バージニア) | green-cip.us-east-1.aliyuncs.com | green-cip-vpc.us-east-1.aliyuncs.com |
米国 (シリコンバレー) | green-cip.us-west-1.aliyuncs.com | 該当なし |
英国 (ロンドン) | green-cip.eu-west-1.aliyuncs.com | 該当なし |
他のプログラミング言語の SDK サンプルコードが必要な場合は、OpenAPI エクスプローラーでこのオペレーションを呼び出すことができます。OpenAPI エクスプローラーは、さまざまな SDK のオペレーションのサンプルコードを動的に生成します。
API
使用上の注意
サービスエンドポイント:https://green-cip.{region}.aliyuncs.com。
TextModeration オペレーションを呼び出して、テキストモデレーションタスクを作成できます。HTTP リクエストを作成する方法の詳細については、リクエスト構文をご参照ください。既存の HTTP リクエストを選択することもできます。詳細については、テキストモデレーション 2.0 サービスの使用をご参照ください。
課金方法
このオペレーションの呼び出しには料金が発生します。HTTP ステータスコードが 200 のリクエストに対してのみ、従量課金方式で課金されます。課金方法の詳細については、課金方法をご参照ください。
QPS 制限
このオペレーションは、アカウントごとに 1 秒あたり最大 100 回呼び出すことができます。1 秒あたりの呼び出し数が制限を超えると、スロットリングがトリガーされます。その結果、ビジネスに影響が及ぶ可能性があります。このオペレーションを呼び出すときは、制限に注意することをお勧めします。
リクエストパラメーター
パラメーター | タイプ | 必須 | 例 | 説明 |
[サービス] | String | はい | comment_multilingual_global | モデレーションサービスのタイプ。有効な値:comment_multilingual_global:国際ビジネスシナリオでの多言語モデレーション。 |
[サービスパラメーター] | JSONString | はい | モデレーションサービスに必要なパラメーター。値は JSON 文字列です。各文字列の説明については、ServiceParameters をご参照ください。 |
表 1 ServiceParameters
パラメーター | タイプ | 必須 | 例 | 説明 |
[コンテンツ] | String | はい | モデレートされるコンテンツ | モデレートされるテキスト。長さは 600 文字以内にする必要があります。 |
[アカウント ID] | String | いいえ | 10123**** | アカウントを一意に識別するアカウント ID。 |
[デバイス ID] | String | いいえ | 20240307**** | デバイスを一意に識別するデバイス ID。 |
[デバイストークン] | String | いいえ | MzQvo1d7scyZ3tl_RcJ****** | リスクコントロール SDK を使用して取得したデバイストークン。 |
レスポンスパラメーター
パラメーター | タイプ | 例 | 説明 |
[コード] | Integer | 200 | 返された HTTP ステータスコード。詳細については、エラーコードをご参照ください。 |
[データ] | JSONObject | モデレーション結果。詳細については、データをご参照ください。 | |
[メッセージ] | String | OK | リクエストに応じて返されるメッセージ。 |
[リクエスト ID] | String | AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE**** | リクエスト ID。 |
表 2 データ
パラメーター | タイプ | 例 | 説明 |
[ラベル] | String | sexual_content | ラベル。複数のラベルはコンマ (,) で区切られます。有効な値:
|
[理由] | String | {"customizedWords": "HXXXXX","detectedLanguage": "en","riskTips": "sexuality_Suggestive","riskWords": "pxxxxy","translatedContent": "pxxxxy sxxxx,HXXXXX","customizedLibs": "ZXXXXX"} | 原因を特定するために使用される JSON 文字列。有効な値:
|
[アカウント ID] | String | 10123**** | Alibaba Cloud アカウントの ID。 説明 リクエストで accountId パラメーターを指定した場合、レスポンスで accountId パラメーターの値が返されます。 |
[デバイス ID] | String | 20240307**** | デバイス ID。 説明 リクエストで deviceId パラメーターを指定した場合、レスポンスで deviceId パラメーターの値が返されます。 |
例
サンプルリクエスト
{
"Service": "comment_multilingual_global",
"ServiceParameters": {
"content": "testing content", // テストコンテンツ
"accountId": "10123****"
}
}サンプルレスポンス:
カスタム用語ライブラリの用語とリスクのある単語の両方が検出された場合、次のサンプルコードが返されます。
{
"Code": 200,
"Data": {
"Labels": "C_customized,profanity",
"Reason": "{\"riskLevel\":\"high\",\"customizedWords\":\"HXXXXX\",\"detectedLanguage\":\"en\",\"riskTips\":\"sexuality_Suggestive\",\"riskWords\":\"pxxxxy\",\"translatedContent\":\"pxxxxy sxxxx,HXXXXX\",\"customizedLibs\":\"ZXXXXX\"}"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}カスタム用語ライブラリの用語のみが検出された場合、次のサンプルコードが返されます。
{
"Code": 200,
"Data": {
"Labels": "C_customized",
"Reason": "{\"riskLevel\":\"high\",\"customizedWords\":\"HXXXXX\",\"detectedLanguage\":\"en\",\"translatedContent\":\"HXXXXX\",\"customizedLibs\":\"ZXXXXX\"}"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}リスクのある単語のみが検出された場合、次のサンプルコードが返されます。
{
"Code": 200,
"Data": {
"Labels": "sexuality",
"Reason": "{\"riskLevel\":\"high\",\"detectedLanguage\":\"ar\",\"riskTips\":\"sexuality_Suggestive\",\"riskWords\":\"pxxxxy\",\"translatedContent\":\"pxxxxy sxxxx\"}"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}カスタム用語ライブラリの用語もリスクのある単語も検出されなかった場合、次のサンプルコードが返されます。
{
"Code": 200,
"Data": {
"Labels": "",
"Reason": "{\"detectedLanguage\":\"en\",\"translatedContent\":\"AXXXXXX\"}"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}エラーコード
HTTP ステータスコード | エラーコード | 説明 |
200 | OK | リクエストは成功しました。 |
400 | BAD_REQUEST | リクエストが正しくありません。無効なリクエストパラメーターが原因である可能性があります。リクエストパラメーターをよく確認してください。 |
407 | NOT_SUPPORT | 言語が識別されていないか、サポートされていません。 |
408 | PERMISSION_DENY | アカウントが承認されていないか、アカウントの期限が切れているか、アカウントが有効になっていないか、アカウントが禁止されている可能性があります。 |
500 | GENERAL_ERROR | エラー。サーバーで一時的なエラーが発生した可能性があります。もう一度お試しください。エラーコードが解決しない場合は、サポートとサービスでチケットを送信してください。 |
581 | TIMEOUT | 操作がタイムアウトしました。もう一度お試しください。エラーコードが解決しない場合は、サポートとサービスでチケットを送信してください。 |
588 | EXCEED_QUOTA | QPS がクォータを超えています。 |