ID_OCR_MAX は、Qwen-VL 大規模言語モデルを活用して、世界中の各種 ID 証明書を検出し認識する ID Verification ソリューションです。
地域ごとにモデルの制約があるため、対応するドキュメント種別は異なります。
シンガポールリージョン:「ドキュメント種別」表に記載されたすべてのドキュメント種別をサポートします。
インドネシアリージョン:インドネシア国内の身分証明書(ID カード)およびグローバルパスポート(ドキュメント種別コード:
IDN01001およびGLB03002)のみをサポートします。マレーシアリージョン:マレーシア国内の身分証明書(ID カード)およびグローバルパスポート(ドキュメント種別コード:
MYS01001およびGLB03002)のみをサポートします。
エンドポイント
API 操作:DocOcrMax
説明:Qwen-VL 大規模言語モデルを用いて、提供された ID 証明書画像のドキュメント種別を認識し、情報を抽出したうえで、関連するフィールドを返します。
リクエストメソッド:POST
トランスポートプロトコル:HTTPS
この API 操作には専用の QPS 制限があります。詳細については、「ID Verification サーバーサイド API 操作の QPS 制限」をご参照ください。
サービスエンドポイント:
説明内部ネットワークアクセスのメリット:内部ネットワークとは、同一リージョン内の Alibaba Cloud 製品間で構成される非公開通信ネットワークです。ご利用のビジネスサーバーが対応する Alibaba Cloud リージョンにデプロイされている場合、内部の同一リージョンエンドポイントを使用して ID Verification サービスにアクセスできます。これにより、より安全かつ安定した通信が実現します。
中国以外からのアクセス向け最適化の提案:中国以外のネットワーク環境は複雑である可能性があります。統合ソリューションの最適化、ネットワーク遅延の低減、およびリクエスト失敗の最小化のためには、「サーバーサイドのネットワーク遅延分析と最適化」をご参照ください。
シンガポール
パブリックネットワーク:
cloudauth-intl.ap-southeast-1.aliyuncs.com内部ネットワーク:
cloudauth-intl-vpc.ap-southeast-1.aliyuncs.com
インドネシア
パブリックネットワーク:
cloudauth-intl.ap-southeast-5.aliyuncs.com内部ネットワーク:
cloudauth-intl-vpc.ap-southeast-5.aliyuncs.com
オンラインデバッグおよび統合
API 操作のデバッグおよび統合を開始する前に、「OpenAPI Explorer を使用したサーバーサイド API 操作のデバッグおよび統合」をご参照ください。OpenAPI Explorer を使用した API 呼び出し方法、SDK およびサンプルコードの取得方法について説明しています。
この API 操作は、 OpenAPI Explorer で直接実行してデバッグできます。 また、 SDK サンプルコード も生成できます。
画像フォーマットの要件
モデルの安定した性能を確保するため、以下のすべての要件を満たす画像をアップロードしてください:
画像フォーマット:JPG、JPEG、または PNG。
画像サイズ:推奨サイズは 50 KB ~ 100 KB です。最大サイズは 10 MB です。
説明画像を Base64 形式に変換すると、データサイズが増加します。Base64 形式のパラメーターが 10 MB のデータ転送制限を超えないようにするため、元の画像サイズは 6 MB を超えてはなりません。
画像解像度:画像の高さおよび幅は 200 ピクセル以上、8192 ピクセル以下である必要があります。推奨解像度は 480 × 640(高さ × 幅)です。
画像品質に関する推奨事項:
ドキュメント画像の四隅がすべて見えるようにしてください。ドキュメントを保持する際に四隅を隠さないよう注意してください。四隅が隠れると検出精度が低下する可能性があります。
ドキュメント画像の内容は鮮明で、遮蔽されておらず、過露出がない状態である必要があります。また、ドキュメント画像は正立しており、傾斜や上下逆になっていない必要があります。
ドキュメント画像は、全体の画像領域の 60 % 以上を占める必要があります。ドキュメント画像が小さいと認識精度が低下する可能性があります。
実際のドキュメントの写真を撮影してください。
リクエストパラメーター
画像のアップロードには、以下の 2 つの方法のいずれかを使用できます。
IdOcrPictureBase64
IdOcrPictureUrl
名前 | 型 | 必須 | 説明 | 例 |
ProductCode | String | はい | 使用する製品ソリューションを指定します。値は ID_OCR_MAX に設定します。 | ID_OCR_MAX |
SceneCode | String | いいえ | カスタム認証シナリオ ID です。コンソールで関連レコードを照会するために使用できます。 英字、数字、アンダースコアの組み合わせで、最大 10 文字までです。 | 1234567890 |
MerchantBizId | String | はい | カスタムの一意なビジネス ID です。後続の問題の特定およびトラブルシューティングに使用します。 英字および数字の組み合わせで、最大 32 文字までです。ID は一意である必要があります。 | e0c34a77f5ac40a5aa5e6ed20c35**** |
MerchantUserId | String | いいえ | カスタムユーザー ID または特定のユーザーを識別する他の識別子(例:携帯電話番号やメールアドレスなど)です。 このフィールドの値は事前に匿名化(例:ハッシュ化)してください。 | 123456789 |
IdOcrPictureBase64 | String | いいえ | ID 証明書の Base64 エンコード済み画像です。 IdOcrPictureBase64 を使用して ID 証明書画像を渡す場合は、画像サイズを確認してください。サイズが大きすぎる画像は渡さないでください。 | base64 |
IdOcrPictureUrl | String | いいえ | ID 証明書画像の URL です。URL はインターネット経由でアクセス可能な HTTP または HTTPS リンクである必要があります。 | https://***.jpg |
OcrModel | String | いいえ | OCR 認識モード: 説明 モード 1 および 2 では、ドキュメント品質検査およびなりすまし検出機能はサポートされません。詳細については、「認識モードの違い」をご参照ください。
| 0 |
DocType | String | いいえ | 説明
| GLB03001 |
DocPage | String | いいえ | 認識対象のページです。
重要 モデルが検出したページと指定されたページが一致しない場合、Subcode 213 が返されます。 | 01 |
IdSpoof | String | いいえ | ドキュメントのなりすまし検出機能を有効化するかどうかを指定します:
| F |
IdThreshold | String | いいえ | OCR 品質検査のカスタムしきい値モード:
| 3 |
OcrValueStandard | String | いいえ | 標準化されたフォーマットで追加の OCR フィールドを返すかどうかを指定します:
説明 対応するドキュメント種別および標準化フィールドの詳細については、「フィールドの標準化」をご参照ください。 | 0 |
Authorize | String | いいえ | 信頼できるデータソースとの照合による検証を有効化するかどうかを指定します。このパラメーターは、IdSpoof が有効化されている場合にのみ適用されます。
説明
| T |
認識モードの違い
OCR 認識モード | 入力の違い | 出力の違い | 推奨される利用シーン |
0:指定ドキュメント認識モード |
| このモードでは、ドキュメントページから詳細なフィールドが出力されます。詳細については、「ドキュメント OCR フィールド」をご参照ください。 | ID Verification を使用したオンラインでの本人登録(オンボーディング)シナリオに推奨されます。このモードでは、ドキュメント種別がお客様のビジネスで許可されているかを自動的に検証し、ドキュメントの表側(顔写真面)から詳細なフィールドを出力します。 |
1:自動ドキュメント分類モード 重要 この認識モードは、シンガポールリージョンでのみサポートされています。 |
| このモードでは、検出されたドキュメント種別コードのみが出力されます。詳細については、「グローバル ID 証明書コード」をご参照ください。 | オフラインのビジネス分析シナリオに推奨されます。このモードを使用して、過去の ID 証明書画像のクラスタリングおよびクリーニングを行うことができます。 |
2:自動ドキュメント分類および汎用認識モード 重要 この認識モードは、シンガポールリージョンでのみサポートされています。 |
| このモードでは、ドキュメント種別およびドキュメントの表側(顔写真面)から得られる主要な標準化フィールドが出力されます。詳細については、「汎用認識フィールドの表」をご参照ください。 説明 このモードでは、異なるドキュメント種別に共通するフィールドのみが出力されます。 | 補助的な手動レビューを必要とするオフラインシナリオに推奨されます。このモードでは、ドキュメント種別および主要なフィールドを認識することで、レビューの効率を向上させます。 |
フィールドの標準化
世界中の多様な ID 証明書に対応するため、ID Verification はフィールドの標準化機能を提供し、以下の主要なドキュメントフィールドに対して標準化された出力フォーマットを生成します。
対応するドキュメント種別
現在は、以下のドキュメント種別のみがサポートされています。今後の追加対応は、需要に基づいて決定されます。
氏名のルールは複雑であるため、ラテン文字による氏名の標準化は不正確になる可能性があります。最終的には、エンドユーザーが自身の氏名を手動で確認するよう促す必要があります。
中国 | CHN01001 | 01、02 | |
台湾 (中国) | TWN01001 | 01 | |
韓国 | KOR01001 | 01 | |
KOR02001 | 01 | ||
KOR03001 | 01 |
対応する標準化フィールド
フィールド | 型 | 説明 |
surname_s | String | ラテン文字による姓。 |
given_name_s | String | ラテン文字の名称。 |
sex_s | String | 性別(F または M)。 |
date_of_birth_s | String | 生年月日(yyyy-mm-dd 形式)。 |
date_of_expiry_s | String | ドキュメントの有効期限は、yyyy-mm-dd フォーマットです。 |
レスポンスパラメーター
名前 | 型 | 説明 | 例 | |
HTTP ステータスコード | Integer | HTTP ステータスコード。 | 200 | |
HTTP ボディ | RequestId | String | リクエスト ID。 | 130A2C10-B9EE-4D84-88E3-5384F******** |
Result.TransactionId | String | 認証プロセス全体のユニーク ID。 | hksb7ba1b28130d24e015d694******** | |
Code | String | Success | ||
Message | String | 戻りコードの詳細な説明。 | success | |
Result.Passed | String | 認識が完了したかどうかを示します。 | Y | |
Result.SubCode | String | 200 | ||
Result.ExtIdInfo | String |
|
| |
ExtIdInfo
名前 | 型 | 説明 | 例 |
ocrIdInfo | String | ID 証明書の OCR フィールド情報です。 説明 ID 証明書の OCR 処理が失敗した場合、このフィールドは空になります。 | |
spoofInfo | String | 証明書のなりすまし検出結果(リスク結果およびリスクタイプを含む)です。 説明 証明書検出は、Initialize 操作で IdSpoof を Y に設定した場合にのみ有効になります。 それ以外の場合、spoofResult はデフォルトで N を返し、spoofType は空になります。
| |
ocrDocType | String | 説明 このフィールドは、OcrModel を 1 または 2 に設定した場合にのみ返されます。 | CHN01 |
ocrStandardData | String | ID 証明書の標準化された OCR フィールド情報です。 説明 このフィールドは、ドキュメント種別がサポートされており、 | |
戻りコード
HTTP ステータスコード | コード | 説明 |
200 | Success | リクエストが成功しました。 |
400 | MissingParameter | パラメーターが空です。 |
InvalidParameter | 無効なパラメーターです。 | |
401 | UnqualifiedPhoto | アップロードされた画像が読み取れない、または画像解像度が要件を満たしていません。画像を変更することを推奨します。 写真が鮮明で、適切な露出であり、完全で遮蔽されておらず、大きな角度のずれがないことを確認してください。 |
DataDuplication | Base64 エンコード済み画像と URL 画像アドレスの両方が提供されています。これらのパラメーターのうち、いずれか 1 つだけを選択してください。 | |
ToolargeImage | 画像サイズが大きすぎます。画像を圧縮するか、アップロード方法を変更することを推奨します。 | |
DownloadTimeout | URL 画像のダウンロードタイムアウトです。 | |
403 | Forbidden.RAMUserAccessDenied | RAM ユーザーに AliyunAntCloudAuthFullAccess 権限を付与する必要があります。詳細については、「RAM ユーザーへのサービスアクセス権限の付与」をご参照ください。 |
Forbidden.AccountAccessDenied | ID Verification の有効化を確認し、アカウントに支払い遅延がないことを確認してください。 | |
Throttling.Api | 速度制限により API リクエストがブロックされました。 | |
500 | InternalError | 内部システムエラーです。トラブルシューティングのためにエンジニアにフィードバックしてください。 |
503 | ServiceUnavailable | サービスが利用できません。トラブルシューティングのためにエンジニアにお問い合わせください。 |
ResultObject.SubCode エラーコード
Subcode は、使用する製品ソリューションや統合方法によって異なります。詳細については、以下の表をご参照ください。
対応するソリューション | エラーコード | 認証レコードの課金対象 | 説明および推奨される原因 |
一般 | 200 | はい | 認証が通過しました。 |
| 211 | はい | ID 証明書画像の品質または解像度が要件を満たしていない、または画像自体が不完全です。ID 証明書の表側(顔写真面)の写真が鮮明で、適切な露出であり、完全で遮蔽されておらず、大きな角度のずれがないことを確認してください。 |
| 212 | はい | 証明書の偽造防止検出でリスクが検出されました。再撮影、改ざん、コピーなどの高リスク操作が行われている可能性があります。 |
| 213 | はい | 指定された証明書種別が検出されませんでした(認識モード)または証明書種別を特定できませんでした(分類モード)。 鮮明で完全な証明書画像を、適切な角度でアップロードすることを推奨します。 |