All Products
Search
Document Center

Realtime Compute for Apache Flink:Model DDL

Last Updated:Apr 03, 2026

Dokumen ini menjelaskan pernyataan bahasa definisi data (DDL) untuk mendaftarkan, mengkueri, memodifikasi, dan menghapus model AI dalam Flink SQL.

Catatan penggunaan

  • Mendukung layanan model AI dari Alibaba Cloud Model Studio, Platform for AI (PAI), dan penyedia lain dengan API yang kompatibel OpenAI.

  • Layanan inferensi yang diterapkan pada Platform for AI (PAI) harus berada di wilayah yang sama dengan layanan Realtime Compute for Apache Flink Anda.

  • Memerlukan Ververica Runtime (VVR) versi 11.1 atau lebih baru.

CREATE MODEL

Daftarkan model

Dalam editor Data Query, jalankan perintah berikut.

CREATE [TEMPORARY] MODEL [catalog_name.][db_name.]model_name
INPUT ( { <physical_column_definition> [, ...n] )
OUTPUT ( { <physical_column_definition> [, ...n] )
WITH (key1=val1, key2=val2, ...)

<physical_column_definition>:
  column_name column_type [COMMENT column_comment]

Klausa

Deskripsi

Parameter kunci

Batasan skema

Contoh

INPUT

Menentukan nama kolom, tipe data, dan urutan data masukan model.

  • column_name

  • column_type

  • COMMENT

Memerlukan tepat satu kolom bertipe STRING.

INPUT (`input_text` STRING COMMENT 'Komentar pengguna')

OUTPUT

Menentukan nama kolom, tipe data, dan urutan data keluaran model.

  • column_name

  • column_type

  • COMMENT

Batasan bervariasi tergantung jenis task model:

OUTPUT (`sentiment_label` STRING COMMENT 'Label sentimen')

WITH

Lihat Parameter WITH.

  • provider

  • endpoint

  • api-key

  • model

Tidak ada.

WITH ('provider'='openai-compat', 'endpoint'='${ENDPOINT}', 'model'='qwen-turbo', 'api-key'='${KEY}')

Contoh

Alibaba Cloud Model Studio

CREATE MODEL model_bailian
INPUT (`input` STRING)
OUTPUT (`content` STRING)
WITH (
  'provider'='openai-compat',
  'endpoint'='<Endpoint>',
  'api-key'='<bailian-key>',
  'model'='qwen3-235b-a22b'
);

Format endpoint untuk Alibaba Cloud Model Studio adalah <base-url>/compatible-mode/v1/<task>. Contohnya, https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions.

Platform for AI (PAI)

CREATE MODEL model_pai
INPUT (`input` STRING)
OUTPUT (`embedding` ARRAY<FLOAT>) 
WITH (
  'provider'='openai-compat',
  'endpoint'='<VPC_endpoint>',
  'api-key'='<Token>',
  'model'='qwen3-235b-a22b'
);

Untuk mendapatkan endpoint dan Kunci API, Anda harus terlebih dahulu menerapkan layanan model. Untuk informasi selengkapnya, lihat Terapkan model DeepSeek-V3 dan DeepSeek-R1 dengan satu klik dan Panduan cepat untuk Elastic Algorithm Service (EAS).

Model Gallery

  1. Masuk ke Konsol Platform for AI (PAI).

  2. Di panel navigasi kiri, buka Model Gallery > Job Management > Deployment Jobs lalu klik nama layanan target.

  3. Klik View Invocation Information.

    • Endpoint VPC menggunakan HTTP. Anda harus mengubahnya menjadi HTTPS dan menambahkan /v1/<task> ke URL. Nilai task dapat berupa salah satu nilai berikut:

      Contohnya: https://************.vpc.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/quickstart_deploy_20250722_7b22/v1/chat/completions.

    • Gunakan nilai dari bidang Token sebagai parameter api-key.

Elastic Algorithm Service (EAS)

  1. Di panel navigasi kiri, buka Elastic Algorithm Service (EAS) > Inference Services, lalu klik nama layanan target untuk membuka halaman Overview.

  2. Di bagian Basic Information, klik View Invocation Information.

  3. Di panel Invocation Information, salin endpoint dan token:

    • Endpoint VPC menggunakan HTTP. Anda harus mengubahnya menjadi HTTPS dan menambahkan /v1/<task> ke URL. Nilai task dapat berupa salah satu nilai berikut:

      Contohnya: https://************.vpc.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/quickstart_deploy_20250722_7b22/v1/chat/completions.

    • Gunakan nilai dari bidang Token sebagai parameter api-key.

Untuk informasi selengkapnya, lihat Panggil layanan menggunakan endpoint publik atau internal melalui gerbang.

WITH parameters

Umum

Parameter

Deskripsi

Tipe

Wajib

Default

Catatan

provider

Jenis layanan model.

string

Ya

Tidak ada

  • VVR 11.1–11.2: Nilainya harus bailian.

  • VVR 11.3–11.6: Nilai yang valid adalah openai-compat dan bailian.

    Kami merekomendasikan menggunakan openai-compat.

Catatan

Untuk layanan model PAI atau lainnya yang kompatibel OpenAI, nilainya harus openai-compat.

endpoint

Titik akhir untuk layanan model yang kompatibel OpenAI, seperti layanan embeddings atau chat/completions.

string

Ya

Tidak ada

  • Untuk endpoint Alibaba Cloud Model Studio atau PAI, lihat Contoh.

  • Untuk layanan model kompatibel OpenAI lainnya, rujuk dokumentasi API layanan tersebut.

api-key

Kunci API untuk layanan model.

string

Ya

Tidak ada

Untuk informasi selengkapnya, lihat Dapatkan Kunci API.

Nama kunci sebelumnya: apiKey (di VVR 11.1).

max-context-size

Ukuran konteks maksimum untuk satu permintaan, dalam token.

integer

Tidak

Tidak ada

Jika kapasitas maksimum terlampaui, aksi yang ditentukan dalam context-overflow-action akan dipicu.

Catatan

Didukung di VVR 11.2 dan versi lebih baru.

context-overflow-action

Aksi yang diambil ketika konteks permintaan melebihi batas token.

string

Tidak

truncated-tail

Nilai yang valid:

  • truncated-tail: Secara otomatis memotong token saat kapasitas terlampaui, menyimpan token max-context-size terbaru. Tidak ada log yang dicatat.

  • truncated-tail-log: Secara otomatis memotong token dari ekor yang melebihi kapasitas, menyimpan token max-context-size terbaru. Pemotongan ini dicatat dalam log.

  • truncated-head: Memotong token awal dari kepala, menyimpan token max-context-size terbaru.

  • truncated-head-log: Memangkas token awal dari kepala, menyimpan token max-context-size terbaru. Mencatat pemotongan tersebut.

  • skipped: Langsung membuang catatan data. Tidak ada log yang dicatat.

  • skipped-log: Membuang data dan mencatat log.

Catatan

Didukung di VVR 11.2 dan versi lebih baru.

max-context-size

Panjang konteks maksimum (jumlah catatan).

integer

Tidak

Tidak ada

Catatan

Didukung di VVR 11.2 dan versi lebih baru.

context-overflow-action

Aksi yang diambil ketika panjang konteks melebihi batas catatan.

string

Tidak

truncated-tail

Nilai yang valid:

  • truncated-tail: Secara otomatis memotong data dari ujung ekor yang melebihi kapasitas, menyimpan item max-context-size terbaru.

  • truncated-head: Memotong data tertua dari awal, menyimpan item data max-context-size terbaru.

  • skipped: Langsung membuang data baru yang melebihi kapasitas dan tidak memperbarui konteks.

  • truncated-tail-log: Berdasarkan truncated-tail dengan mencatat aksi pemotongan konteks.

  • truncated-head-log: Berdasarkan truncated-head dan mencatat aksi pemotongan konteks.

  • skipped-log: Melakukan aksi yang sama seperti skipped dan mencatat log saat konteks dipotong.

Catatan

Didukung di VVR 11.2 dan versi lebih baru.

error-handling-strategy

Strategi penanganan error permintaan model.

string

Tidak

retry

Nilai yang valid:

  • retry: Mengirim ulang permintaan.

  • failover: Melemparkan exception.

  • ignore: Mengabaikan exception dan melewati catatan data.

Catatan

Didukung di VVR 11.4 dan versi lebih baru.

retry-num

Jumlah upaya pengulangan.

integer

Tidak

100

Berlaku hanya ketika error-handling-strategy = retry.

Catatan

Didukung di VVR 11.4 dan versi lebih baru.

retry-fallback-strategy

Strategi fallback yang digunakan setelah jumlah maksimum pengulangan tercapai.

string

Tidak

failover

Nilai yang valid adalah failover dan ignore.

Pengaturan ini berlaku hanya ketika error-handling-strategy diatur ke nilai selain retry.

Catatan

Didukung di VVR 11.4 dan versi lebih baru.

retry-backoff-strategy

Strategi backoff pengulangan.

string

Tidak

fixed

Nilai yang valid:

  • fixed: Interval tetap.

  • exponential: Interval eksponensial.

Catatan

Didukung di VVR 11.4 dan versi lebih baru.

retry-backoff-base-interval

Interval waktu dasar untuk strategi backoff pengulangan.

duration

Tidak

1 s

Catatan

Didukung di VVR 11.4 dan versi lebih baru.

chat/completions

Parameter berikut khusus untuk task model chat/completions:

Parameter

Deskripsi

Jenis

Wajib

Default

Catatan

model

Model yang dipanggil.

string

Ya

Tidak ada

Mendukung model generasi teks.

Catatan

Anda dikenai biaya berdasarkan model yang dipilih dan jumlah token pada input dan output.

system-prompt

Prompt sistem untuk permintaan.

string

Ya

"You are a helpful assistant."

Nama kunci sebelumnya: systemPrompt (di VVR 11.1).

Catatan

Di VVR 11.6 dan versi lebih baru, Anda dapat mengatur parameter ini ke nilai kosong.

temperature

Mengontrol kelancaran distribusi probabilitas untuk setiap token kandidat.

float

Tidak

Tidak ada

Rentang valid: [0, 2). Nilai 0 tidak disarankan.

Suhu yang lebih tinggi membuat output lebih acak, sedangkan nilai yang lebih rendah membuatnya lebih deterministik.

top-p

Ambang batas probabilitas untuk pengambilan sampel inti.

float

Tidak

Tidak ada

Nilai yang lebih tinggi meningkatkan keacakan, sedangkan nilai yang lebih rendah meningkatkan determinisme.

Nama kunci sebelumnya: topP (di VVR 11.1).

stop

Urutan penghentian.

string

Tidak

Tidak ada

Model berhenti menghasilkan token ketika sequens ini dihasilkan. Sequens ini tidak termasuk dalam output akhir.

max-tokens

Jumlah maksimum token yang dapat dihasilkan model.

integer

Tidak

Tidak ada

Nama kunci sebelumnya: maxTokens (di VVR 11.1).

content-type

Jenis data input.

string

Tidak

text

  • Nilai yang valid: text dan image_url.

Catatan

Didukung di VVR 11.6 dan versi lebih baru.

presence-penalty

Mengontrol pengulangan token.

double

Tidak

Tidak ada

Rentang valid: -2.0 hingga 2.0. Nilai positif memberikan penalti pada token yang sudah muncul dalam teks, sehingga model lebih cenderung membahas topik baru.

Catatan

Didukung di VVR 11.3 dan versi lebih baru.

n

Jumlah pilihan output yang dihasilkan untuk setiap pesan input.

integer

Tidak

Tidak ada

Catatan

Didukung di VVR 11.3 dan versi lebih baru.

seed

Seed bilangan acak untuk respons model.

long

Tidak

Tidak ada

Jika ditentukan, penyedia model mencoba pengambilan sampel deterministik, sehingga permintaan berulang dengan seed dan parameter yang sama seharusnya menghasilkan hasil yang sama. Determinisme tidak dijamin.

Catatan

Didukung di VVR 11.3 dan versi lebih baru.

response-format

Format nilai kembali.

string

Tidak

text

Nilai yang valid:

  • text

  • json_object

Catatan

Didukung di VVR 11.3 dan versi lebih baru.

extra-header

Header HTTP tambahan untuk permintaan.

string

Tidak

Tidak ada

Harus berupa string berformat JSON. Nilai dalam pasangan kunci-nilai JSON harus berupa string atau daftar string.

Catatan

Didukung di VVR 11.3 dan versi lebih baru.

extra-body

Body HTTP tambahan untuk permintaan.

string

Tidak

Tidak ada

Harus berupa string berformat JSON.

Catatan

Didukung di VVR 11.3 dan versi lebih baru.

embeddings

Parameter berikut khusus untuk task model embeddings:

Parameter

Deskripsi

Tipe

Wajib

Default

Catatan

model

Model yang dipanggil.

string

Ya

Tidak ada

Mendukung model text embedding.

Catatan

Anda dikenai biaya berdasarkan model yang dipilih dan jumlah token pada input dan output.

dimension

Dimensi vektor output.

integer

Tidak

Tidak ada

Dimensi yang didukung bergantung pada model spesifik. Nilai umum meliputi 1024, 768, dan 512.

Mengkueri model

Dalam editor Data Query, jalankan salah satu perintah berikut.

  • Daftar nama model yang terdaftar:

    SHOW MODELS [ ( FROM | IN ) [catalog_name.]database_name ];
  • Tampilkan pernyataan yang digunakan untuk membuat model:

    SHOW CREATE MODEL [catalog_name.][db_name.]model_name;
  • Tampilkan skema input dan output model:

    DESCRIBE MODEL [catalog_name.][db_name.]model_name;

Contoh

SHOW MODELS;

-- RESULT
--+------------+
--| model name |
--+------------+
--|          m |
--+------------+

DESCRIBE MODEL m;

-- RESULT
-- +---------+--------+------+----------+
-- |    name |   type | null | is input |
-- +---------+--------+------+----------+
-- | content | STRING | TRUE |     TRUE |
-- |   label | BIGINT | TRUE |    FALSE |
-- +---------+--------+------+----------+

Memodifikasi model

Dalam editor Data Query, jalankan perintah berikut.

ALTER MODEL [IF EXISTS] [catalog_name.][db_name.]model_name {
  RENAME TO new_table_name
  SET (key1=val1, ...)
  RESET (key1, ...)
}

Contoh

  • Ganti nama model yang terdaftar:

    ALTER MODEL m RENAME TO m1; -- Mengganti nama model menjadi m1.
  • Ubah parameter model:

    ALTER MODEL m SET ('endpoint' = '<Your_Endpoint>'); -- Menyesuaikan path endpoint.
  • Atur ulang parameter model ke nilai default-nya:

    ALTER MODEL m RESET ('endpoint'); -- Mengatur ulang path endpoint.

Menghapus model

Dalam editor Data Query, jalankan perintah berikut.

DROP [TEMPORARY] MODEL [IF EXISTS] [catalog_name.][db_name.]model_name

Contoh

DROP MODEL m;