すべてのプロダクト
Search
ドキュメントセンター

Realtime Compute for Apache Flink:PDF_TO_IMAGES

最終更新日:Apr 08, 2026

PDF_TO_IMAGES は、PDF ファイルをページごとのイメージに分割し、各ページを行として返すテーブル値関数です。

構文

PDF_TO_IMAGES(content [, image_format] [, dpi] [, start_page] [, pages])

パラメーター

パラメーター必須説明
contentVARBINARYはいPDF ファイルのバイナリコンテンツです。リモートファイルからコンテンツを取得するには、FETCH_CONTENT を使用します。
image_formatSTRINGいいえ出力イメージフォーマットです。サポートされている値: 'jpg''png'。デフォルト: 'jpg'
dpiINTいいえイメージの鮮明度をコントロールする、ドット/インチ (DPI) 単位のレンダリング解像度です。デフォルト: 200
start_pageINTいいえ処理を開始する最初のページです。ページ番号は 0 から始まります。デフォルト: 0
pagesINTいいえstart_page から処理するページ数です。start_page と一緒に使用する必要があり、単独では使用できません。この関数は、[start_page, start_page + pages) の範囲のページを処理します。デフォルト: start_page からドキュメントの最後まで。

戻り値のパラメーター

この関数は、ページごとに 1 行を返し、次の列が含まれます。

パラメーター説明
mime_typeSTRINGimage/jpeg などの出力イメージの MIME タイプです。
page_noINTPDF のページ番号です (0 から始まります)。
image_contentVARBINARYページイメージのバイナリコンテンツです。

次のクエリは、URL から PDF をフェッチし、各ページを 150 DPI の JPEG イメージに変換します。LATERAL TABLE 構文は、PDF_TO_IMAGES をテーブル値関数として呼び出し、その出力行を入力と結合します。

SELECT
    p.mime_type AS mime_type,
    p.page_no AS page_no
FROM (
    SELECT FETCH_CONTENT(pdf_url) AS pdf_content
    FROM (
        VALUES ('https://example.com/sample.pdf')
    ) T (pdf_url)
) AS t1,
LATERAL TABLE(PDF_TO_IMAGES(t1.pdf_content, 'jpg', 150)) AS p(mime_type, page_no, image_content);

出力例:

mime_type(STRING)page_no(INT)
image/jpeg0
image/jpeg1
image/jpeg2
image/jpeg3