すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:画像コンテンツの抽出

最終更新日:Aug 06, 2025

AI Search Open Platform は、API を介した画像コンテンツ抽出サービスの呼び出しをサポートしています。このサービスをビジネス処理チェーンに統合できます。解析されたテキストは、画像検索や会話型リサーチのシナリオに使用できます。

サービス一覧

サービス名

サービス ID

サービスの説明

API 呼び出しの QPS 制限(Alibaba Cloud アカウントおよび RAM ユーザー)

画像コンテンツ理解サービス 001

ops-image-analyze-vlm-001

画像コンテンツ解析サービスを提供します。マルチモーダル大規模モデルに基づいて画像コンテンツを解析および理解し、OCR を実行できます。解析されたテキストは、画像検索や Q&A シナリオに使用できます。

10

説明

より高い QPS を申請するには、チケットを送信してください。

画像テキスト認識サービス 001

ops-image-analyze-ocr-001

画像コンテンツの OCR 認識サービスを提供します。OCR 機能に基づいて画像内のテキストを認識し、テキスト情報を抽出して、画像検索や Q&A シナリオに使用できます。

  • 認証情報を取得します。

    API を使用して AI Search Open Platform サービスを呼び出す場合は、呼び出し元の ID を認証する必要があります。

  • サービスアクセスアドレスを取得します。

    インターネットまたは VPC(Virtual Private Cloud)経由でサービスを呼び出すことができます。詳細については、「サービス登録アドレスを取得する」をご参照ください。

非同期抽出タスクの作成

リクエストメソッド

POST

URL

{host}/v3/openapi/workspaces/{workspace_name}/image-analyze/{service_id}/async
  • host:サービスを呼び出すためのアドレス。API サービスは、パブリックネットワークと VPC の両方で呼び出すことができます。詳細については、「参照ドキュメント」をご参照ください。

  • workspace_name:ワークスペースの名前(例:default)。

  • service_id:組み込みサービス ID(例:ops-image-analyze-vlm-001)。

リクエストパラメーター

ヘッダーパラメーター

API-KEY 認証

パラメーター

タイプ

必須

説明

Content-Type

文字列

はい

リクエストタイプ:application/json

application/json

Authorization

文字列

はい

API-Key

Bearer OS-d1**2a

ボディパラメーター

パラメーター

タイプ

必須

説明

service_id

文字列

はい

組み込みサービス ID:

  • ops-image-analyze-vlm-001

  • ops-image-analyze-ocr-001

ops-image-analyze-vlm-001

document.url

文字列

いいえ

ファイルが保存されている URL アドレスを指定します。URL または content のいずれかを選択する必要があります。 http および https プロトコルをサポートします。

http://path/to/***.jpg

document.content

文字列

いいえ

ファイルのコンテンツを Base64Encode でエンコードして指定します。URL または content のいずれかを選択する必要があります。

"aGVsbG8gd29ybGQ="

document.file_name

文字列

いいえ

ファイル名。空の場合、URL から推測されます。URL が空の場合は、明示的に指定する必要があります。

test.jpg

document.file_type

文字列

いいえ

ファイルタイプ。空の場合、file_name サフィックスから推測されます。推測できない場合は、jpg、jpeg、png、bmp、tiff など、明示的に指定する必要があります。

jpg

レスポンスパラメーター

パラメーター

タイプ

説明

result.task_id

文字列

画像解析非同期タスク ID。

6177bf71-f87f-4d86-ab0c-e2b64dfe****

cURL リクエスト例

curl -X POST \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <Your API key>" \
  "http://***-hangzhou.opensearch.aliyuncs.com/v3/openapi/workspaces/default/image-analyze/ops-image-analyze-vlm-001/async"
  --data '{
    "document": {
      "url": "https://img01.yzcdn.cn/****/2017/05/11/FoTMgBa0SvUaAeFruY7i7O_EUMhf.jpg%21middle.jpg",
      "file_type": "jpg"
    }
  }' \ 

レスポンス例

正常なレスポンス例

{
	"request_id":"CD4E26F0-23FF-449C-83DC-20CC8FF1****",
        "latency":8.0,
        "http_code":200,
        "result":{
                  "task_id":"cd4e26f0-23ff-449c-83dc-20cc8ff1****"
        }
}

異常なレスポンス例

アクセスリクエストでエラーが発生した場合、出力結果には code と message によってエラー理由が示されます。

{
      "request_id":"0CCAC03B-D83F-432F-B6BA-C3049576****",
      "latency":0.0,
      "code":"InvalidParameter",
      "http_code":400,
      "message":"document.content or document.url required, and both cannot be present at the same time"
}

非同期抽出タスクのステータスを取得する

リクエストメソッド

GET

URL

{host}/v3/openapi/workspaces/{workspace_name}/image-analyze/{service_id}/async/task-status?task_id=${task_id}
  • host:サービスを呼び出すためのアドレス。API サービスは、パブリックネットワークと VPC の両方で呼び出すことができます。詳細については、「参照ドキュメント」をご参照ください。

  • workspace_name:ワークスペースの名前(例:default)。

  • service_id:組み込みサービス ID(例:ops-image-analyze-vlm-001)。

  • task_id:画像解析レスポンスで返されたタスク ID(例:cd4e26f0-23ff-449c-83dc-20cc8ff1****)。

リクエストパラメーター

ヘッダーパラメーター

API-KEY 認証

パラメーター

タイプ

必須

説明

Content-Type

文字列

はい

リクエストタイプ:application/json

application/json

Authorization

文字列

はい

API-Key

Bearer OS-d1**2a

レスポンスパラメーター

パラメーター

タイプ

説明

request_id

文字列

システムが API 呼び出しに割り当てた一意の識別子。

3C09570D-12DB-46B4-BF0F-A100D79B****

latency

浮動小数点数/整数

リクエストのレイテンシ(ミリ秒)。

3.0

result.task_id

文字列

非同期タスク ID。同期呼び出しには存在しません。

a7e4c0f6-874c-47e3-b05b-02278a96e****

result.status

文字列

タスクステータス:

  • PENDING:保留中

  • SUCCESS:タスクは正常に完了しました

  • FAILED:タスクは失敗しました

SUCCESS

result.data

オブジェクト

画像解析結果。

{"content":"The image shows XXXX",

"content_type":"plain"}

result.data.content

文字列

画像コンテンツ。

"XXX"

result.data.content_type

文字列

出力テキストタイプ:plain。

plain

usage.token_count

整数

出力されたトークンの数。ops-image-analyze-vlm-001 サービスに適用されます。

1234

usage.pv_count

整数

呼び出し回数(1 に固定)。ops-image-analyze-ocr-001 サービスに適用されます。

1

cURL リクエスト例

curl -X GET \
-H"Content-Type: application/json" \
-H "Authorization: Bearer <Your API key>" \
"http://***-hangzhou.opensearch.aliyuncs.com/v3/openapi/workspaces/default/image-analyze/ops-image-analyze-vlm-001/async/task-status?task_id=d9781786-20b8-4fb4-bbb5-38f82e69****" 
 

レスポンス例

正常なレスポンス例

{
      "request_id":"3C09570D-12DB-46B4-BF0F-A100D79B****",
      "latency":3.0,
      "http_code":200,
      "result":{
           "status":"SUCCESS",
           "data":{
                "content":"The image shows a WMF brand blender surrounded by various fruits and vegetables. Next to the blender is a cup filled with red juice, with a straw inserted. Scattered on the table are a few slices of lemon, some strawberries, and some kiwis. In one corner of the table, there is a cut pineapple and an orange. Additionally, some carrots are cut into small pieces and placed in the blender, ready for juicing. The whole scene looks very healthy and delicious.",
                "content_type":"plain"
            },
            "task_id":"d9781786-20b8-4fb4-bbb5-38f82e69****"
       },
            "usage":{
                "token_count":95
            }
}

異常なレスポンス例

アクセスリクエストでエラーが発生した場合、出力結果には code と message によってエラー理由が示されます。

{
  "request_id":"153FC253-468D-4C46-873E-2AEB918C****",
  "latency":2.0,
  "code":"BadRequest.TaskNotExist",
  "http_code":404,
  "message":"task[d9781786-20b8-4fb4-bbb5-38f82e690b****] not exist"
}

同期抽出タスクの作成

リクエストメソッド

POST

URL

{host}/v3/openapi/workspaces/{workspace_name}/image-analyze/{service_id}/sync

パラメーターの説明

  • host:サービスを呼び出すためのアドレス。API サービスはパブリックネットワークと VPC の両方で呼び出すことができます。詳細については、「参照ドキュメント」をご参照ください。

  • workspace_name:ワークスペースの名前(例:default)。

  • service_id:組み込みサービス ID(例:ops-image-analyze-vlm-001)。

リクエストパラメーター

ヘッダーパラメーター

API-KEY 認証

パラメーター

タイプ

必須

説明

Content-Type

文字列

はい

リクエストタイプ:application/json

application/json

Authorization

文字列

はい

API-Key

Bearer OS-d1**2a

ボディパラメーター

パラメーター

タイプ

必須

説明

service_id

文字列

はい

組み込みサービス ID:

  • ops-image-analyze-vlm-001

  • ops-image-analyze-ocr-001

ops-image-analyze-vlm-001

document.url

文字列

いいえ

ファイルが保存されている URL アドレスを指定します。url または content のいずれかを選択する必要があります。http および https プロトコルをサポートします。

http://path/to/***.jpg

document.content

文字列

いいえ

ドキュメントコンテンツ。Base64Encode でエンコードされています。

document.url または document.content のいずれかを選択する必要があります。

"aGVsbG8gd29ybGQ="

document.file_name

文字列

いいえ

ファイル名。空の場合、URL から推測されます。url が空の場合は、明示的に指定する必要があります。

test.jpg

document.file_type

文字列

いいえ

ファイルタイプ。空の場合、file_name サフィックスから推測されます。推測できない場合は、jpg、jpeg、png、bmp、tiff など、明示的に指定する必要があります。

jpg

レスポンスパラメーター

パラメーター

タイプ

説明

result.status

文字列

タスクステータス:

  • PENDING:保留中

  • SUCCESS:タスクは正常に完了しました

  • FAIL:タスクは失敗しました

SUCCESS

result.error

文字列

status=FAIL の場合のエラーメッセージ。通常は空です。

ドキュメントの復号に失敗しました

result.data

オブジェクト

画像解析結果。

{"content":"The image shows XXXX",

"content_type":"plain"}

result.data.content

文字列

画像コンテンツ。

"XXX"

result.data.content_type

文字列

出力テキストタイプ:plain。

Plain

request_id

文字列

システムが API 呼び出しに割り当てた一意の識別子。

B4AB89C8-B135-xxxx-A6F8-2BAB801A2CE4

latency

浮動小数点数/整数

リクエストレイテンシ(ミリ秒)。

10

usage

オブジェクト

この呼び出しの課金情報。

"usage": {

"token_count": 1234

}

usage.token_count

整数

出力されたトークンの数。ops-image-analyze-vlm-001 サービスに適用されます。

1234

usage.pv_count

整数

呼び出し回数(1 に固定)。ops-image-analyze-ocr-001 サービスに適用されます。

1

cURL リクエスト例

curl -X POST \
-H"Content-Type: application/json" \
-H "Authorization: Bearer <Your API key>" \
 "http://***-hangzhou.opensearch.aliyuncs.com/v3/openapi/workspaces/default/image-analyze/ops-image-analyze-vlm-001/sync" \
\ -d "{    
      \"document\":{    
            \"url\":\"https://img01.yzcdn.cn/****/2017/05/11/FoTMgBa0SvUaAeFruY7i7O_EUMhf.jpg%21middle.jpg\",   
            \"file_type\":\"jpg\"
      }
}"

レスポンス例

正常なレスポンス例

{
    "request_id":"BB5CD4C3-C8B6-40E7-A037-4ADAE88A****", 
    "latency":12525.0,
    "http_code":200,
    "result":{
        "status":"SUCCESS",
        "data":{
              "content":"The image shows a WMF brand blender surrounded by various fruits and vegetables. Next to the blender is a cup filled with red juice, with a straw inserted. Scattered on the table are a few slices of lemon, some strawberries, and some kiwis. In one corner of the table, there is a cut pineapple and an orange. Additionally, some carrots are cut into small pieces and placed in the blender, ready for juicing. The whole scene looks very healthy and delicious.",
              "content_type":"plain"
        }
      },
      "usage":{
          "token_count":95
      }
}

異常なレスポンス例

アクセスリクエストでエラーが発生した場合、出力結果には code と message によってエラー理由が示されます。

{
    "request_id": "6F33AFB6-A35C-4DA7-AFD2-9EA16CCF****",
    "latency": 2.0,
    "code": "InvalidParameter",
    "http_code": 400,
    "message": "JSON parse error: Cannot deserialize value of type `ImageStorage` from String \\"xxx\\""
}

状態コードの説明

HTTP ステータスコード

エラーコード

説明

200

-

リクエスト成功。タスク失敗のシナリオも含みます。実際のタスクステータスは result.status から判断する必要があります。

404

BadRequest.TaskNotExist

タスクが存在しません。

400

InvalidParameter

無効なリクエスト。

500

InternalServerError

内部エラー。

その他の状態コードの説明については、「参照ドキュメント」をご参照ください。