AI Search Open Platform は、API を介した画像コンテンツ抽出サービスの呼び出しをサポートしています。このサービスをビジネス処理チェーンに統合できます。解析されたテキストは、画像検索や会話型リサーチのシナリオに使用できます。
サービス一覧
サービス名 | サービス ID | サービスの説明 | API 呼び出しの QPS 制限(Alibaba Cloud アカウントおよび RAM ユーザー) |
画像コンテンツ理解サービス 001 | ops-image-analyze-vlm-001 | 画像コンテンツ解析サービスを提供します。マルチモーダル大規模モデルに基づいて画像コンテンツを解析および理解し、OCR を実行できます。解析されたテキストは、画像検索や Q&A シナリオに使用できます。 | 10 説明 より高い QPS を申請するには、チケットを送信してください。 |
画像テキスト認識サービス 001 | ops-image-analyze-ocr-001 | 画像コンテンツの OCR 認識サービスを提供します。OCR 機能に基づいて画像内のテキストを認識し、テキスト情報を抽出して、画像検索や Q&A シナリオに使用できます。 |
認証情報を取得します。
API を使用して AI Search Open Platform サービスを呼び出す場合は、呼び出し元の ID を認証する必要があります。
サービスアクセスアドレスを取得します。
インターネットまたは VPC(Virtual Private Cloud)経由でサービスを呼び出すことができます。詳細については、「サービス登録アドレスを取得する」をご参照ください。
非同期抽出タスクの作成
リクエストメソッド
POST
URL
{host}/v3/openapi/workspaces/{workspace_name}/image-analyze/{service_id}/asynchost:サービスを呼び出すためのアドレス。API サービスは、パブリックネットワークと VPC の両方で呼び出すことができます。詳細については、「参照ドキュメント」をご参照ください。
workspace_name:ワークスペースの名前(例:default)。
service_id:組み込みサービス ID(例:ops-image-analyze-vlm-001)。
リクエストパラメーター
ヘッダーパラメーター
API-KEY 認証
パラメーター | タイプ | 必須 | 説明 | 例 |
Content-Type | 文字列 | はい | リクエストタイプ:application/json | application/json |
Authorization | 文字列 | はい | API-Key | Bearer OS-d1**2a |
ボディパラメーター
パラメーター | タイプ | 必須 | 説明 | 例 |
service_id | 文字列 | はい | 組み込みサービス ID:
| ops-image-analyze-vlm-001 |
document.url | 文字列 | いいえ | ファイルが保存されている URL アドレスを指定します。URL または content のいずれかを選択する必要があります。 http および https プロトコルをサポートします。 | http://path/to/***.jpg |
document.content | 文字列 | いいえ | ファイルのコンテンツを Base64Encode でエンコードして指定します。URL または content のいずれかを選択する必要があります。 | "aGVsbG8gd29ybGQ=" |
document.file_name | 文字列 | いいえ | ファイル名。空の場合、URL から推測されます。URL が空の場合は、明示的に指定する必要があります。 | test.jpg |
document.file_type | 文字列 | いいえ | ファイルタイプ。空の場合、file_name サフィックスから推測されます。推測できない場合は、jpg、jpeg、png、bmp、tiff など、明示的に指定する必要があります。 | jpg |
レスポンスパラメーター
パラメーター | タイプ | 説明 | 例 |
result.task_id | 文字列 | 画像解析非同期タスク ID。 | 6177bf71-f87f-4d86-ab0c-e2b64dfe**** |
cURL リクエスト例
curl -X POST \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <Your API key>" \
"http://***-hangzhou.opensearch.aliyuncs.com/v3/openapi/workspaces/default/image-analyze/ops-image-analyze-vlm-001/async"
--data '{
"document": {
"url": "https://img01.yzcdn.cn/****/2017/05/11/FoTMgBa0SvUaAeFruY7i7O_EUMhf.jpg%21middle.jpg",
"file_type": "jpg"
}
}' \
レスポンス例
正常なレスポンス例
{
"request_id":"CD4E26F0-23FF-449C-83DC-20CC8FF1****",
"latency":8.0,
"http_code":200,
"result":{
"task_id":"cd4e26f0-23ff-449c-83dc-20cc8ff1****"
}
}異常なレスポンス例
アクセスリクエストでエラーが発生した場合、出力結果には code と message によってエラー理由が示されます。
{
"request_id":"0CCAC03B-D83F-432F-B6BA-C3049576****",
"latency":0.0,
"code":"InvalidParameter",
"http_code":400,
"message":"document.content or document.url required, and both cannot be present at the same time"
}非同期抽出タスクのステータスを取得する
リクエストメソッド
GET
URL
{host}/v3/openapi/workspaces/{workspace_name}/image-analyze/{service_id}/async/task-status?task_id=${task_id}host:サービスを呼び出すためのアドレス。API サービスは、パブリックネットワークと VPC の両方で呼び出すことができます。詳細については、「参照ドキュメント」をご参照ください。
workspace_name:ワークスペースの名前(例:default)。
service_id:組み込みサービス ID(例:ops-image-analyze-vlm-001)。
task_id:画像解析レスポンスで返されたタスク ID(例:cd4e26f0-23ff-449c-83dc-20cc8ff1****)。
リクエストパラメーター
ヘッダーパラメーター
API-KEY 認証
パラメーター | タイプ | 必須 | 説明 | 例 |
Content-Type | 文字列 | はい | リクエストタイプ:application/json | application/json |
Authorization | 文字列 | はい | API-Key | Bearer OS-d1**2a |
レスポンスパラメーター
パラメーター | タイプ | 説明 | 例 |
request_id | 文字列 | システムが API 呼び出しに割り当てた一意の識別子。 | 3C09570D-12DB-46B4-BF0F-A100D79B**** |
latency | 浮動小数点数/整数 | リクエストのレイテンシ(ミリ秒)。 | 3.0 |
result.task_id | 文字列 | 非同期タスク ID。同期呼び出しには存在しません。 | a7e4c0f6-874c-47e3-b05b-02278a96e**** |
result.status | 文字列 | タスクステータス:
| SUCCESS |
result.data | オブジェクト | 画像解析結果。 | {"content":"The image shows XXXX", "content_type":"plain"} |
result.data.content | 文字列 | 画像コンテンツ。 | "XXX" |
result.data.content_type | 文字列 | 出力テキストタイプ:plain。 | plain |
usage.token_count | 整数 | 出力されたトークンの数。ops-image-analyze-vlm-001 サービスに適用されます。 | 1234 |
usage.pv_count | 整数 | 呼び出し回数(1 に固定)。ops-image-analyze-ocr-001 サービスに適用されます。 | 1 |
cURL リクエスト例
curl -X GET \
-H"Content-Type: application/json" \
-H "Authorization: Bearer <Your API key>" \
"http://***-hangzhou.opensearch.aliyuncs.com/v3/openapi/workspaces/default/image-analyze/ops-image-analyze-vlm-001/async/task-status?task_id=d9781786-20b8-4fb4-bbb5-38f82e69****"
レスポンス例
正常なレスポンス例
{
"request_id":"3C09570D-12DB-46B4-BF0F-A100D79B****",
"latency":3.0,
"http_code":200,
"result":{
"status":"SUCCESS",
"data":{
"content":"The image shows a WMF brand blender surrounded by various fruits and vegetables. Next to the blender is a cup filled with red juice, with a straw inserted. Scattered on the table are a few slices of lemon, some strawberries, and some kiwis. In one corner of the table, there is a cut pineapple and an orange. Additionally, some carrots are cut into small pieces and placed in the blender, ready for juicing. The whole scene looks very healthy and delicious.",
"content_type":"plain"
},
"task_id":"d9781786-20b8-4fb4-bbb5-38f82e69****"
},
"usage":{
"token_count":95
}
}異常なレスポンス例
アクセスリクエストでエラーが発生した場合、出力結果には code と message によってエラー理由が示されます。
{
"request_id":"153FC253-468D-4C46-873E-2AEB918C****",
"latency":2.0,
"code":"BadRequest.TaskNotExist",
"http_code":404,
"message":"task[d9781786-20b8-4fb4-bbb5-38f82e690b****] not exist"
}同期抽出タスクの作成
リクエストメソッド
POST
URL
{host}/v3/openapi/workspaces/{workspace_name}/image-analyze/{service_id}/syncパラメーターの説明
host:サービスを呼び出すためのアドレス。API サービスはパブリックネットワークと VPC の両方で呼び出すことができます。詳細については、「参照ドキュメント」をご参照ください。
workspace_name:ワークスペースの名前(例:default)。
service_id:組み込みサービス ID(例:ops-image-analyze-vlm-001)。
リクエストパラメーター
ヘッダーパラメーター
API-KEY 認証
パラメーター | タイプ | 必須 | 説明 | 例 |
Content-Type | 文字列 | はい | リクエストタイプ:application/json | application/json |
Authorization | 文字列 | はい | API-Key | Bearer OS-d1**2a |
ボディパラメーター
パラメーター | タイプ | 必須 | 説明 | 例 |
service_id | 文字列 | はい | 組み込みサービス ID:
| ops-image-analyze-vlm-001 |
document.url | 文字列 | いいえ | ファイルが保存されている URL アドレスを指定します。url または content のいずれかを選択する必要があります。http および https プロトコルをサポートします。 | http://path/to/***.jpg |
document.content | 文字列 | いいえ | ドキュメントコンテンツ。Base64Encode でエンコードされています。 document.url または document.content のいずれかを選択する必要があります。 | "aGVsbG8gd29ybGQ=" |
document.file_name | 文字列 | いいえ | ファイル名。空の場合、URL から推測されます。url が空の場合は、明示的に指定する必要があります。 | test.jpg |
document.file_type | 文字列 | いいえ | ファイルタイプ。空の場合、file_name サフィックスから推測されます。推測できない場合は、jpg、jpeg、png、bmp、tiff など、明示的に指定する必要があります。 | jpg |
レスポンスパラメーター
パラメーター | タイプ | 説明 | 例 |
result.status | 文字列 | タスクステータス:
| SUCCESS |
result.error | 文字列 | status=FAIL の場合のエラーメッセージ。通常は空です。 | ドキュメントの復号に失敗しました |
result.data | オブジェクト | 画像解析結果。 | {"content":"The image shows XXXX", "content_type":"plain"} |
result.data.content | 文字列 | 画像コンテンツ。 | "XXX" |
result.data.content_type | 文字列 | 出力テキストタイプ:plain。 | Plain |
request_id | 文字列 | システムが API 呼び出しに割り当てた一意の識別子。 | B4AB89C8-B135-xxxx-A6F8-2BAB801A2CE4 |
latency | 浮動小数点数/整数 | リクエストレイテンシ(ミリ秒)。 | 10 |
usage | オブジェクト | この呼び出しの課金情報。 | "usage": { "token_count": 1234 } |
usage.token_count | 整数 | 出力されたトークンの数。ops-image-analyze-vlm-001 サービスに適用されます。 | 1234 |
usage.pv_count | 整数 | 呼び出し回数(1 に固定)。ops-image-analyze-ocr-001 サービスに適用されます。 | 1 |
cURL リクエスト例
curl -X POST \
-H"Content-Type: application/json" \
-H "Authorization: Bearer <Your API key>" \
"http://***-hangzhou.opensearch.aliyuncs.com/v3/openapi/workspaces/default/image-analyze/ops-image-analyze-vlm-001/sync" \
\ -d "{
\"document\":{
\"url\":\"https://img01.yzcdn.cn/****/2017/05/11/FoTMgBa0SvUaAeFruY7i7O_EUMhf.jpg%21middle.jpg\",
\"file_type\":\"jpg\"
}
}"レスポンス例
正常なレスポンス例
{
"request_id":"BB5CD4C3-C8B6-40E7-A037-4ADAE88A****",
"latency":12525.0,
"http_code":200,
"result":{
"status":"SUCCESS",
"data":{
"content":"The image shows a WMF brand blender surrounded by various fruits and vegetables. Next to the blender is a cup filled with red juice, with a straw inserted. Scattered on the table are a few slices of lemon, some strawberries, and some kiwis. In one corner of the table, there is a cut pineapple and an orange. Additionally, some carrots are cut into small pieces and placed in the blender, ready for juicing. The whole scene looks very healthy and delicious.",
"content_type":"plain"
}
},
"usage":{
"token_count":95
}
}異常なレスポンス例
アクセスリクエストでエラーが発生した場合、出力結果には code と message によってエラー理由が示されます。
{
"request_id": "6F33AFB6-A35C-4DA7-AFD2-9EA16CCF****",
"latency": 2.0,
"code": "InvalidParameter",
"http_code": 400,
"message": "JSON parse error: Cannot deserialize value of type `ImageStorage` from String \\"xxx\\""
}状態コードの説明
HTTP ステータスコード | エラーコード | 説明 |
200 | - | リクエスト成功。タスク失敗のシナリオも含みます。実際のタスクステータスは result.status から判断する必要があります。 |
404 | BadRequest.TaskNotExist | タスクが存在しません。 |
400 | InvalidParameter | 無効なリクエスト。 |
500 | InternalServerError | 内部エラー。 |
その他の状態コードの説明については、「参照ドキュメント」をご参照ください。