このトピックでは、AI_SUMMARIZE を使用して大規模な AI モデルでテキスト要約を生成する方法について説明します。
制限事項
Ververica Runtime (VVR) 11.4 以降のバージョンのみがサポートされています。
AI_SUMMARIZE 文に関連する Flink オペレーターのスループットは、モデルプラットフォームの速度制限によって制限されます。プラットフォームのトラフィック制限に達すると、Flink ジョブでバックプレッシャーが発生し、このオペレーターがボトルネックになります。深刻な速度制限が発生した場合、関連するオペレーターでタイムアウトエラーやジョブの再起動がトリガーされる可能性があります。
構文
AI_SUMMARIZE(
MODEL => MODEL <MODEL NAME>,
INPUT => <INPUT COLUMN NAME>,
MAX_LENGTH => <MAX LENGTH>
)入力パラメーター
パラメーター | データ型 | 説明 |
MODEL <MODEL NAME> | MODEL | 登録されたモデルサービスの名前。詳細については、「モデル設定」をご参照のうえ、モデルサービスを登録してください。 注意:このモデルの出力タイプは VARIANT である必要があります。 |
<INPUT COLUMN NAME> | STRING | モデルが分析するデータ。 |
<MAX LENGTH> | INTEGER | モデル出力の最大長。 注意:この入力パラメーターは定数である必要があります。 |
出力
パラメーター | データ型 | 説明 |
summary | STRING | 要約されたコンテンツ。 |
例
テストデータ
id | description |
1 | Flink とは Apache Flink は、リアルタイムデータストリームとバッチデータに対するステートフル計算のための、オープンソースの分散ストリーム処理フレームワークです。 簡単に言うと: Flink はリアルタイムデータを処理するコンピュートエンジンです。 ウェブサイトのクリック、IoT (Internet of Things) センサーデータ、株式取引などの連続的なデータストリームを処理できます。 低レイテンシー、高スループット、および 1回限りのセマンティクスを提供します。 ストリーム処理とバッチ処理の両方をサポートします。 |
テスト文
次のサンプル SQL は、Qwen-Plus モデルを作成し、AI_SUMMARIZE 関数を使用して入力データを要約します。
CREATE TEMPORARY MODEL general_model
INPUT (`input` STRING)
OUTPUT (`content` VARIANT)
WITH (
'provider' = 'openai-compat',
'endpoint'='<YOUR ENDPOINT>',
'apiKey' = '<YOUR KEY>',
'model' = 'qwen-plus'
);
CREATE TEMPORARY VIEW infos(id, description)
AS VALUES (1, '
What is Flink
Apache Flink is an open-source, distributed stream processing framework for stateful computations on real-time data streams and batch data.
In simple terms:
Flink is a compute engine that processes real-time data.
It can process continuous data streams, such as website clicks, Internet of Things (IoT) sensor data, and stock trades.
It provides low latency, high throughput, and exactly-once semantics.
It supports both stream processing and batch processing.
');
-- 位置引数を使用して AI_SUMMARIZE を呼び出す
SELECT id, summary
FROM infos, LATERAL TABLE(
AI_SUMMARIZE(MODEL general_model, description, 10));
-- 名前付き引数を使用して AI_SUMMARIZE を呼び出す
SELECT id, summary
FROM infos, LATERAL TABLE(
AI_SUMMARIZE(
MODEL => MODEL general_model,
INPUT => description,
MAX_LENGTH => 10));出力結果
id | summary |
1 | リアルタイムストリーム処理エンジン |