All Products
Search
Document Center

Platform For AI:Feature Database FeatureDB

Last Updated:Jun 21, 2026

FeatureDB adalah layanan database yang disediakan oleh platform FeatureStore (PAI-FeatureStore) di Alibaba Cloud PAI. Layanan ini berfungsi sebagai online store untuk FeatureStore, menyediakan penyimpanan fitur online berkinerja tinggi serta operasi baca/tulis yang dioptimalkan untuk layanan seperti pencarian, rekomendasi, dan periklanan. Topik ini memperkenalkan FeatureDB serta menjelaskan fitur dan manfaatnya.

Apa itu FeatureDB

FeatureDB adalah database penyimpanan terdistribusi berkinerja tinggi yang disediakan oleh FeatureStore. Layanan ini mendukung format data KV dan KKV serta memungkinkan penyimpanan array terstruktur sebagai tipe Array dan pasangan kunci-nilai sebagai tipe Map. Menyimpan data dalam tipe Array dan Map memberikan kinerja lebih tinggi untuk operasi baca/tulis selanjutnya dan layanan inferensi. FeatureDB mendukung penuh pipeline produksi, pembaruan, dan konsumsi untuk fitur offline maupun real-time, termasuk fitur urutan perilaku pengguna.

Cara mengaktifkan

Aktifkan FeatureDB saat membuat sumber data FeatureDB baru dengan mengikuti petunjuk di layar. Untuk detailnya, lihat Buat sumber data online: FeatureDB.

Fitur produk

FeatureDB menerapkan kemampuan dan optimisasi berikut yang disesuaikan dengan karakteristik pembacaan data fitur FeatureStore:

  • Mendukung pembacaan dan penulisan fitur tipe KV dan KKV.

  • Mendukung pembacaan dan penulisan fitur tipe kompleks MaxCompute (Array, Map).

  • Mendukung pengambilan semua data fitur di bawah FeatureView secara lengkap.

  • Mendukung polling tingkat milidetik untuk memperbarui data fitur real-time.

  • Mendukung TTL tingkat detik untuk membersihkan data yang kedaluwarsa secara otomatis.

  • Menggunakan penagihan pay-as-you-go berdasarkan volume data baca dan tulis aktual.

FeatureDB membagi data FeatureView ke dalam beberapa partisi. Sesuaikan jumlah shard untuk memenuhi kebutuhan kinerja baca/tulis pada berbagai skenario. Replika juga didukung untuk memastikan stabilitas dan keamanan data. Jumlah shard ditentukan berdasarkan Estimated Data Scale yang Anda pilih:

  • Below tens of millions (default): 5 shard.

  • Between tens of millions and hundreds of millions: 10 shard.

  • Above hundreds of millions: 20 shard.

Pada kotak dialog Create Feature View, pilih skala yang sesuai dari daftar drop-down Estimated Data Scale.

Manfaat

  • Efektivitas Biaya yang Tinggi

    Pelanggan dengan penyimpanan fitur skala kecil dapat mengurangi biaya menggunakan FeatureDB.

  • Memenuhi kebutuhan pembaruan frekuensi tinggi

    Saat menggunakan fitur statistik real-time, Anda harus memperbarui fitur real-time ke beberapa instans EasyRec Processor (layanan inferensi model) setiap beberapa detik. Hal ini menuntut pembaruan frekuensi tinggi yang didukung oleh FeatureDB.

  • Mendukung fitur tipe kompleks

    Dalam skenario pencarian dan periklanan, fitur tipe Array dan Map, urutan perilaku pengguna yang panjang, serta SideInfo-nya banyak digunakan. Menyimpan fitur tipe kompleks sebagai string memerlukan serialisasi ke tipe Map saat digunakan, yang menurunkan kinerja.

    FeatureDB mendukung penyimpanan data tipe kompleks secara native dan memungkinkan sinkronisasi data tipe kompleks MaxCompute 2.0 ke FeatureDB untuk pembacaan berkinerja tinggi.

  • Mendukung scale-out elastis

    Pelanggan skala besar dapat secara fleksibel menambah jumlah shard per tampilan fitur untuk meningkatkan kinerja baca/tulis.

  • Menghilangkan titik buta pemantauan

    Mengintegrasikan sumber data pihak ketiga menyulitkan pemantauan pipa data end-to-end, terutama untuk fitur real-time. FeatureDB memantau metrik kinerja utama—termasuk QPS baca/tulis, RT, latensi pembaruan data, dan penggunaan penyimpanan—pada granularitas setiap tampilan.

Kemampuan produk

Konektivitas VPC berkecepatan tinggi

FeatureDB menyediakan konektivitas VPC berkecepatan tinggi melalui PrivateLink. Setelah dikonfigurasi dengan sukses, FeatureStore menggunakan PrivateLink untuk menghubungkan VPC Anda ke layanan FeatureDB. Anda kemudian dapat mengakses FeatureDB melalui koneksi privat dari dalam VPC Anda menggunakan FeatureStore SDK, meningkatkan kinerja baca/tulis data dan mengurangi latensi akses.

Konfigurasikan konektivitas VPC berkecepatan tinggi sebagai berikut:

  • Metode 1: Jika Anda belum membuat sumber data FeatureDB, klik Manage Data Source . Pada halaman Manage Data Source, klik Create Data Source . Saat membuat sumber data FeatureDB, isi bagian VPC Direct Connection Configurations dengan VPC dan Zone and vSwitch Anda. Untuk langkah-langkah detail, lihat Buat sumber data online: FeatureDB.

  • Metode 2: Jika Anda telah membuat sumber data FeatureDB, klik Manage Data Source . Pada halaman Manage Data Source, klik sumber data feature_db yang sudah ada untuk membuka halaman produknya. Klik VPC Direct Connection Configurations, masukkan VPC dan Zone and vSwitch Anda, lalu klik Confirm.

Catatan

  • Setelah ditetapkan, VPC tidak dapat diubah. Pastikan VPC yang dikonfigurasi sesuai dengan VPC yang digunakan oleh layanan online FeatureStore Anda.

  • Deploy layanan Anda di zona yang direkomendasikan untuk menghindari latensi jaringan lintas zona dan memaksimalkan kinerja akses.

    Area

    Wilayah

    Zona yang Direkomendasikan

    Asia-Pasifik

    Tiongkok (Hangzhou)

    Zona G

    Tiongkok (Shanghai)

    Zona L

    Tiongkok (Beijing)

    Zona F

    Tiongkok (Shenzhen)

    Zona F

    Hong Kong (Tiongkok)

    Zona B

    Singapura

    Zona C

    Indonesia (Jakarta)

    Zona B

    Eropa dan Amerika

    Jerman (Frankfurt)

    Zona A

    AS (Silicon Valley)

    Zona B

  • Zone and vSwitch: Pastikan Anda memilih vSwitch di zona yang sama dengan instans layanan online Anda. Untuk ketersediaan tinggi dan stabilitas, pilih vSwitch di minimal dua zona—lebih baik di zona tempat layanan online Anda berjalan dan zona yang direkomendasikan di atas.

  • Setelah konfigurasi berhasil, Anda hanya dapat menambahkan vSwitch dari zona lain. Anda tidak dapat mengubah atau menghapus konfigurasi yang sudah ada.

Menulis fitur

Untuk fitur offline, gunakan FeatureStore Python SDK dengan DataWorks untuk menjalankan tugas terjadwal harian yang menyinkronkan data dari MaxCompute ke FeatureDB.

Secara default, penulisan fitur real-time melakukan pembaruan baris penuh. Jika data yang ditulis hanya mencakup sebagian bidang, bidang yang tidak ada akan diatur menjadi kosong. Untuk memperbarui hanya bidang tertentu dan menggabungkannya ke data yang sudah ada, konfigurasikan sebagai berikut:

  • Saat menulis melalui Java SDK: Tentukan InsertMode sebagai InsertMode.PartialFieldWrite.

    for (int i = 0; i < 100;i++) {
        featureView.writeFeatures(writeData, InsertMode.PartialFieldWrite);
    }
  • Saat menulis melalui Flink Connector: Atur parameter insert_mode menjadi partial_field_write.

Baca fitur

Gunakan FeatureStore SDK (Go/Java) atau EasyRec Processor untuk membaca fitur.

FeatureStore SDK (Go/Java) mendukung join point-in-time KV untuk fitur offline dan real-time. Tentukan JoinID (kunci primer) dan nama fitur untuk menyelesaikan kueri KV dan mengambil data fitur target dalam hitungan milidetik. SDK juga mendukung kueri KKV untuk fitur urutan perilaku. Tentukan UserID untuk mengambil hasil fitur urutan yang telah dirakit.

EasyRec Processor mengintegrasikan FeatureStore C++ SDK, memungkinkan pemuatan penuh data fitur FeatureDB ke memori dan polling tingkat milidetik untuk memperbarui fitur real-time di memori demi kinerja baca yang lebih tinggi.

Metrik pemantauan

Jika Anda menggunakan FeatureDB sebagai online store, setelah membuat tampilan fitur, klik Data Monitoring di sebelah tampilan target untuk melihat metrik seperti QPS baca/tulis dan RT. (Catatan: Penulisan dari sinkronisasi data tampilan fitur offline tidak muncul dalam metrik ini.)

Pipa fitur real-time

Layanan penyimpanan FeatureStore terdiri dari tiga komponen: Feature Service (lapisan akses), antrian pesan (DataHub), dan FeatureDB.

Untuk fitur real-time, Anda dapat memanggil Feature Service melalui FeatureStore Java SDK atau Flink Connector untuk menulis data fitur ke FeatureDB. Data yang ditulis melalui Feature Service juga disinkronkan ke tabel MaxCompute Anda untuk ekspor sampel fitur real-time dan pelatihan model lebih lanjut.

Anda dapat membaca data fitur yang tersimpan di FeatureDB menggunakan FeatureStore Java/Go SDK atau menarik semua fitur ke cache lokal melalui EasyRec Processor untuk kinerja baca yang lebih tinggi. Fitur real-time menghadirkan informasi fitur terbaru dalam hitungan milidetik.

Pengaturan siklus hidup data fitur real-time

Saat membuat tampilan fitur real-time, atur siklus hidup data untuk tabel FeatureDB menggunakan Feature Lifecycle . Baris kedaluwarsa dan dibersihkan secara otomatis dalam hitungan detik setelah mencapai durasi siklus hidupnya.

Waktu hidup (TTL) data saat ini mendukung dua metode konfigurasi:

  • Metode 1: Jangan tentukan bidang Event Time. Dalam kasus ini, masa berlaku dimulai dari waktu penulisan data, dan baris dibersihkan secara otomatis saat kedaluwarsa.

  • Metode 2: Pilih bidang fitur sebagai bidang Event Time (satuan: milidetik). Misalkan event_time adalah nilai bidang Event Time, time_now adalah waktu saat ini, dan time_ttl = time_now - ttl adalah ambang batas event_time untuk kedaluwarsa. FeatureDB menangani data yang ditulis sebagai berikut:

    • Jika menggunakan mode PartialFieldWrite untuk pembaruan sebagian bidang, masa berlaku dihitung dari waktu penulisan aktual.

    • Jika event_time > time_now + 15 menit: Data tidak ditulis. (Hal ini mencegah perbedaan cap waktu antar sistem dengan memberikan buffer 15 menit.)

    • Jika time_ttl < event_time <= time_now + 15 menit: Data ditulis secara normal. Masa berlaku dimulai dari event_time, dan baris dibersihkan secara otomatis saat kedaluwarsa.

    • Jika 0 < event_time < time_ttl: Data ditulis tetapi segera dibersihkan. Catatan: event_time dalam satuan milidetik. Jika bidang Event Time Anda menggunakan satuan detik, data akan masuk ke kasus ini dan gagal dipertahankan.

    • Jika event_time <= 0: Masa berlaku dihitung dari waktu penulisan aktual.

    • Jika nilainya tidak valid (tidak dapat dikonversi ke bilangan bulat): Data tidak ditulis.

    • Bidang Event Time telah didaftarkan tetapi tidak ada nilai yang diberikan untuk bidang Event Time: data ditulis secara normal, dan masa berlakunya dihitung berdasarkan waktu penulisan aktual.

    • Jika tidak ada bidang Event Time yang didaftarkan: Data ditulis secara normal, dan masa berlaku dihitung dari waktu penulisan aktual.

    • Selain itu, FeatureDB menggunakan nilai event_time sebagai cap waktu (ts) baris tersebut. Untuk memperbarui data untuk kunci tertentu, nilai Event Time baru harus lebih besar dari atau sama dengan nilai sebelumnya. Jika event_time baru lebih kecil dari nilai aslinya, data kunci tersebut tidak akan diperbarui.

Performance Testing

Berikut ini menunjukkan contoh hasil uji beban membaca data FeatureDB menggunakan FeatureStore Go SDK di lingkungan VPC. Data uji berasal dari tabel sisi pengguna dalam skenario rekomendasi, dengan total 17.689.586 baris. Uji coba dijalankan pada mesin 4-core, 8 GiB. Hasil hanya untuk referensi.

  • Dengan Konektivitas Jaringan VPC Berkecepatan Tinggi dikonfigurasi dan layanan online dideploy di zona yang direkomendasikan:

    Jumlah bidang fitur (kolom)

    Jumlah kunci yang dibaca (baris)

    Latensi rata-rata

    TP95

    TP99

    260

    1

    0,89 ms

    1,20 ms

    1,45 ms

    260

    10

    1,17 ms

    1,52 ms

    1,87 ms

    260

    50

    1,91 ms

    2,56 ms

    2,92 ms

    260

    100

    2,87 ms

    3,58 ms

    3,93 ms

    260

    200

    4,43 ms

    5,25 ms

    5,80 ms

  • Dengan Konektivitas Jaringan VPC Berkecepatan Tinggi dikonfigurasi tetapi layanan online dideploy di zona non-rekomendasi:

    Jumlah bidang fitur (kolom)

    Jumlah kunci yang dibaca (baris)

    Latensi rata-rata

    TP95

    TP99

    260

    1

    2,54 ms

    2,86 ms

    3,15 ms

    260

    10

    2,75 ms

    3,12 ms

    3,56 ms

    260

    50

    3,95 ms

    4,75 ms

    5,19 ms

    260

    100

    4,82 ms

    5,66 ms

    6,21 ms

    260

    200

    6,84 ms

    7,75 ms

    8,25 ms

  • Tanpa Konektivitas Jaringan VPC Berkecepatan Tinggi dikonfigurasi:

    Jumlah bidang fitur (kolom)

    Jumlah kunci yang dibaca (baris)

    Latensi rata-rata

    TP95

    TP99

    260

    1

    3,62 ms

    3,83 ms

    4,27 ms

    260

    10

    3,82 ms

    4,11 ms

    4,61 ms

    260

    50

    4,54 ms

    5,19 ms

    5,60 ms

    260

    100

    5,40 ms

    6,13 ms

    6,56 ms

    260

    200

    7,15 ms

    7,93 ms

    8,47 ms

Billing

Untuk detailnya, lihat Penagihan FeatureStore.