すべてのプロダクト
Search
ドキュメントセンター

Intelligent Media Management:DetectImageTexts

最終更新日:Feb 26, 2026

イメージからテキストコンテンツを認識し、抽出します。

操作説明

  • この操作を呼び出す前に、Intelligent Media Management (IMM) の課金について精通していることを確認してください。****

  • イメージのサイズは 20 MB を超えることはできません。

  • イメージの最も短い辺は 20 px 以上、最も長い辺は 30,000 px 以下である必要があります。

  • イメージの縦横比は 1:2 未満である必要があります。

  • サイズが 15 px × 15 px 未満のイメージは使用しないことを推奨します。そうしないと、認識率が低くなります。

今すぐお試しください

この API を OpenAPI Explorer でお試しください。手作業による署名は必要ありません。呼び出しに成功すると、入力したパラメーターに基づき、資格情報が組み込まれた SDK コードが自動的に生成されます。このコードをダウンロードしてローカルで使用できます。

テスト

RAM 認証

下表に、この API を呼び出すために必要な認証情報を示します。認証情報は、RAM (Resource Access Management) ポリシーを使用して定義できます。以下で各列名について説明します。

  • アクション:特定のリソースに対して実行可能な操作。ポリシー構文ではAction要素として指定します。

  • API:アクションを具体的に実行するための API。

  • アクセスレベル:各 API に対して事前定義されているアクセスの種類。有効な値:create、list、get、update、delete。

  • リソースタイプ:アクションが作用するリソースの種類。リソースレベルでの権限をサポートするかどうかを示すことができます。ポリシーの有効性を確保するため、アクションの対象として適切なリソースを指定してください。

    • リソースレベルの権限を持つ API の場合、必要なリソースタイプはアスタリスク (*) でマークされます。ポリシーのResource要素で対応する ARN を指定してください。

    • リソースレベルの権限を持たない API の場合、「すべてのリソース」と表示され、ポリシーのResource要素でアスタリスク (*) でマークされます。

  • 条件キー:サービスによって定義された条件のキー。このキーにより、きめ細やかなアクセス制御が可能になります。この制御は、アクション単体に適用することも、特定のリソースに対するアクションに適用することもできます。Alibaba Cloud は、サービス固有の条件キーに加えて、すべての RAM 統合サービスに適用可能な一連の共通条件キーを提供しています。

  • 依存アクション:ある特定のアクションを実行するために、前提として実行が必要となる他のアクション。依存アクションの権限も RAM ユーザーまたは RAM ロールに付与する必要があります。

アクション

アクセスレベル

リソースタイプ

条件キー

依存アクション

imm:DetectImageTexts

none

*Project

acs:imm:{#regionId}:{#accountId}:project/{#ProjectName}

なし なし

リクエストパラメーター

パラメーター

必須 / 任意

説明

ProjectName

string

必須

プロジェクトの名前。 詳細については、「CreateProject」をご参照ください。

test-project

SourceURI

string

必須

ファイルの Object Storage Service (OSS) URI。

URI は oss://${Bucket}/${Object} のフォーマットで指定します。 ${Bucket} は、現在のプロジェクトと同じリージョンにある OSS バケットの名前を指定します。 ${Object} は、拡張子を含むオブジェクトのパスを指定します。

oss://test-bucket/test-object.jpg

CredentialConfig CredentialConfig

任意

特別な要件がない場合は、このパラメーターを空のままにしてください。

権限付与チェーンの設定。 詳細については、「権限付与チェーンを使用して他のエンティティのリソースにアクセスする」をご参照ください。

レスポンスフィールド

フィールド

説明

object

レスポンスパラメーター。

RequestId

string

リクエスト ID。

1B3D5E0A-D8B8-4DA0-8127-ED32C851****

OCRTexts

string

OCRContents のコンテンツを連結した、完全な光学文字認識 (OCR) テキスト。

智能媒体管理。

OCRContents

array

OCR テキストブロック。

OCRContents

イメージから抽出されたテキストブロック。 各要素には、コンテンツや位置などのテキストブロック情報が含まれます。

成功レスポンス

JSONJSON

{
  "RequestId": "1B3D5E0A-D8B8-4DA0-8127-ED32C851****",
  "OCRTexts": "智能媒体管理。",
  "OCRContents": [
    {
      "Language": "zh-hans",
      "Contents": "欢迎使用智能媒体管理",
      "Confidence": 0.8254936695098877,
      "Boundary": {
        "Width": 200,
        "Height": 300,
        "Left": 10,
        "Top": 30,
        "Polygon": [
          {
            "X": 10,
            "Y": 10
          }
        ]
      }
    }
  ]
}

エラーコード

完全なリストについては、「エラーコード」をご参照ください。

変更履歴

完全なリストについては、「変更履歴」をご参照ください。