Saat menerapkan chatbot model bahasa besar (LLM) berbasis Retrieval-Augmented Generation (RAG) di Platform for AI (PAI), Anda dapat menggunakan Tablestore sebagai database vektor. Topik ini menjelaskan cara menggunakan Tablestore sebagai database vektor dalam penerapan chatbot LLM berbasis RAG dengan konfigurasi JSON.
Informasi latar belakang
EAS
PAI menyediakan platform terpadu untuk pengembangan dan penerapan model. Modul Elastic Algorithm Service (EAS) dari PAI memungkinkan Anda menerapkan model sebagai layanan inferensi online menggunakan grup sumber daya publik atau khusus. Model dimuat pada perangkat keras heterogen (CPU dan GPU) untuk menghasilkan respons secara real-time.
Tablestore
Tablestore adalah sistem penyimpanan dan pengambilan data masif yang hemat biaya dan berperforma tinggi. Sistem ini mendukung fitur pengambilan vektor dengan laju tinggi (pengambilan multimodal serta pengambilan skalar dan vektor campuran) dan performa tinggi (pengindeksan real-time, kueri dalam milidetik, dan mendukung hingga 10 miliar vektor per tabel) untuk memastikan stabilitas dan keamanan layanan (VPC khusus, ketersediaan 99,99%, dan reliabilitas data sebesar 12 sembilan).
RAG
RAG mengambil informasi relevan dari basis pengetahuan eksternal, menggabungkannya dengan input pengguna, lalu melewatkan input gabungan ke LLM. Hal ini meningkatkan kemampuan tanya-jawab berbasis pengetahuan LLM di domain tertentu. Gambar berikut menunjukkan cara mengunggah, menyimpan, dan mengambil file basis pengetahuan saat Tablestore digunakan sebagai database vektor aplikasi RAG.

Catatan penggunaan
Dalam contoh ini, model LLM DeepSeek-R1-Distill-Qwen-1.5B diterapkan pada instance tipe ecs.gn7i-c16g1.4xlarge. Untuk informasi tentang metode penagihan EAS, lihat Penagihan EAS.
Jika hanya ingin menguji proses penerapan, segera hapus layanan setelah penerapan untuk mencegah biaya tak terduga dari sumber daya.
Prosedur
Langkah 1: Siapkan database vektor Tablestore
Aktifkan Tablestore
Jika Tablestore sudah diaktifkan, lewati langkah ini.
Masuk ke halaman halaman detail produk.
Klik Get it Free.
Di halaman Table Store (Pay-As-You-Go), klik Buy Now.
Di halaman Confirm Order, baca perjanjian dengan cermat, pilih I have read and agree to Table Store (Pay-As-You-Go) Agreement of Service, lalu klik Activate Now.
Setelah mengaktifkan Tablestore, klik Console untuk masuk ke konsol Tablestore.
Buat instance Tablestore
Anda juga dapat memilih instance yang ada sebagai database vektor. Dalam hal ini, Anda harus menyiapkan informasi seperti nama instance, titik akhir virtual private cloud (VPC), dan pasangan AccessKey dengan izin akses pada instance.
Masuk ke konsol Tablestore.
Di bilah navigasi atas, pilih grup sumber daya dan wilayah, lalu klik Create Instance.
Di kotak dialog Billing Method, tentukan Instance Name dan Instance Type, lalu klik OK.
Peroleh informasi koneksi
Klik nama instance atau Kelola Instance untuk masuk ke tab Detail Instance. Di tab Detail Instance, Anda dapat melihat URL akses instance dan nama instance.
CatatanGunakan titik akhir VPC sebagai URL akses instance.
Buat pasangan AccessKey untuk akun Alibaba Cloud atau pengguna RAM yang memiliki izin akses ke Tablestore.
Langkah 2: Gunakan EAS untuk menerapkan chatbot LLM berbasis RAG
Aktifkan PAI dan buat ruang kerja default.
PentingAktifkan PAI di wilayah yang sama dengan instance Tablestore.
Di panel navigasi sisi kiri konsol PAI, pilih Model Deployment > Elastic Algorithm Service (EAS).
Di halaman Elastic Algorithm Service (EAS), klik Deploy Service. Di halaman yang muncul, klik JSON Deployment.
Di halaman Penerapan JSON, masukkan konfigurasi penerapan dan klik Deploy. Di pesan yang muncul, klik OK.
Setelah menyelesaikan langkah-langkah di atas, sistem segera mulai menerapkan chatbot LLM berbasis RAG. Proses penerapan memakan waktu sekitar 5 menit. Setelah penerapan selesai, status layanan berubah menjadi Berjalan.
Jika tabel data vektor yang ditentukan tidak ada, sistem secara otomatis membuat tabel data dan mengonfigurasi indeks pencarian untuk instance Tablestore selama penerapan.
Langkah 3: Gunakan chatbot LLM berbasis RAG
Di daftar layanan, temukan layanan yang telah diterapkan dan klik View Web App di kolom Service Type. Di kotak dialog yang muncul, klik Web App.
Di tab Upload dari PAI-RAG Dashboard, unggah file basis pengetahuan.

Setelah file basis pengetahuan diurai dan diunggah, Anda dapat melihat data vektor yang ditulis ke file di konsol Tablestore.
Di tab Chat dari PAI-RAG Dashboard, masukkan pertanyaan dan klik Submit untuk memulai percakapan.
Untuk informasi lebih lanjut tentang debugging antarmuka web, seperti mengubah database vektor, LLM, dan tipe file yang didukung oleh basis pengetahuan, lihat Chatbot LLM Berbasis RAG.