Sistem Q&A perusahaan sering kali memberikan jawaban yang tidak akurat. Anda dapat membangun aplikasi generasi yang diperkaya dengan pengambilan data (RAG) dengan mengintegrasikan Dify dan database vektor Alibaba Cloud Tablestore. Solusi ini menyediakan pengambilan pengetahuan yang akurat dan kemampuan Q&A cerdas.
Ikhtisar solusi
Tablestore adalah database vektor berkinerja tinggi yang memberikan respons kueri dalam hitungan milidetik serta mendukung mode pengambilan hibrida yang menggabungkan pencarian vektor dengan pencarian teks penuh. Tabel tunggal dapat menyimpan puluhan miliar vektor. Dify menangani orkestrasi aplikasi dan antarmuka pengguna, sehingga sangat menyederhanakan proses pembuatan dan penerapan aplikasi RAG.
Aplikasi RAG menggunakan proses inti berikut untuk Q&A cerdas:
Vektorisasi Pengetahuan: Dify secara otomatis membagi dokumen perusahaan menjadi segmen pengetahuan, mengubahnya menjadi representasi vektor, dan menyimpannya di database vektor Tablestore.
Pencarian Kesamaan: Ketika pengguna mengajukan pertanyaan, sistem dengan cepat mengambil segmen pengetahuan yang paling relevan dari Tablestore.
Generasi yang Diperkaya: Pengetahuan yang diambil digabungkan dengan pertanyaan pengguna dan disediakan ke model bahasa besar untuk menghasilkan jawaban yang akurat dan berdasarkan fakta.
Siapkan lingkungan penyebaran
Buat instance Tablestore
Tablestore berfungsi sebagai database vektor untuk aplikasi RAG, menyimpan representasi vektor dokumen dan menyediakan kemampuan pencarian kesamaan yang efisien.
Masuk ke Konsol Tablestore. Di bagian atas halaman, pilih wilayah untuk instans, seperti
China (Hangzhou).Klik Create Instance dan pilih CU Mode (formerly Pay-As-You-Go Mode). Atur parameter instans seperti yang dijelaskan dalam daftar berikut. Pertahankan pengaturan default untuk item konfigurasi lainnya.
Instance Name: Masukkan nama untuk instans.
Instance Type: Pilih Compute-optimized Instance.
Klik OK untuk membuat instans.
Buat instance ECS
Instance ECS berfungsi sebagai lingkungan runtime untuk aplikasi Dify dan membutuhkan sumber daya komputasi yang cukup untuk mendukung operasi kluster kontainer Docker.
Buat instance ECS dengan parameter yang tercantum di bawah ini. Anda bisa mempertahankan pengaturan default untuk item konfigurasi lainnya.
Untuk Billing Method, pilih Pay-as-you-go.
Region: Pilih wilayah tempat instans berada. Mengingat pertimbangan jaringan, topik ini menggunakan wilayah China (Hong Kong).
Network and Zone: Pilih virtual private cloud (VPC) dan zona default.
Instance: Klik All Specifications untuk mencari dan memilih
ecs.e-c1m2.large.CatatanJika tipe instans ini habis terjual, pilih yang lain.
Image: Di bagian Public Image, pilih Alibaba Cloud Linux (Alibaba Cloud Linux 3.2104 LTS 64-bit).
System Disk: Atur kapasitas ESSD Entry menjadi 40 GiB.
Untuk Public IP, pilih Allocate Public IPv4 Address.
Bandwidth Billing Method: Anda dapat memilih Pay-by-Traffic untuk menghemat biaya.
Untuk Peak Bandwidth, pilih 5 Mbps atau lebih tinggi.
Untuk Security Group, pilih Existing Security Group.
Logon Credentials: Pilih Custom Password. Setel nama masuk ke root dan setel Logon Password. Simpan kata sandi di lokasi yang aman.
Sebarkan dan akses Dify
Langkah 1: Instal lingkungan Docker
Dify diterapkan dalam kontainer. Oleh karena itu, Anda harus terlebih dahulu menginstal Docker dan Docker Compose pada instans ECS untuk mendukung orkestrasi kontainer multi-layanan.
Instal plug-in dnf-plugins-core.
dnf -y install dnf-plugins-coreKonfigurasikan repositori Docker resmi.
dnf config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repoInstal Docker Engine dan plug-in Docker Compose.
dnf -y install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-pluginMulai Docker dan aktifkan untuk mulai secara otomatis saat startup sistem.
systemctl enable --now docker
Langkah 2: Sebarkan layanan Dify
Selanjutnya, clone kode sumber Dify dan konfigurasikan variabel lingkungan, terutama parameter koneksi untuk Tablestore, yang berfungsi sebagai database vektor.
Instal alat kontrol versi Git.
yum -y install gitClone repositori kode sumber Dify resmi.
git clone https://github.com/langgenius/dify.gitPergi ke direktori penyebaran Docker.
cd dify/dockerSalin file template konfigurasi lingkungan.
cp .env.example .envEdit file konfigurasi lingkungan.
vi .envUbah item konfigurasi berikut:
Item Konfigurasi
Deskripsi
VECTOR_STORE
Tipe database vektor. Atur ke
tablestore.TABLESTORE_ENDPOINT
PentingInstance Tablestore baru memiliki akses jaringan publik dinonaktifkan secara default. Untuk menggunakan titik akhir publik, pergi ke Konsol Tablestore. Pada halaman Instance Management, klik tab Network Management. Di bagian Allowed Network Types, pilih Public Network dan klik Set untuk menyimpan konfigurasi.
Pergi ke Konsol Tablestore. Dalam Instance List, klik alias instans untuk pergi ke halaman Instance Management. Salin nama instans dan titik akhir. Pilih titik akhir berdasarkan penyebaran Anda:
Jika instans ECS dan instans Tablestore berada di wilayah yang sama, Anda dapat menggunakan titik akhir publik atau titik akhir VPC.
Jika instans ECS dan instans Tablestore berada di wilayah yang berbeda, Anda harus menggunakan titik akhir publik.
TABLESTORE_INSTANCE_NAME
TABLESTORE_ACCESS_KEY_ID
Pergi ke halaman Manajemen AccessKey untuk membuat AccessKey untuk Akun Alibaba Cloud Anda. Dapatkan dan simpan ACCESS_KEY_ID dan ACCESS_KEY_SECRET.
TABLESTORE_ACCESS_KEY_SECRET
Mulai kluster kontainer Dify.
docker compose up -dSetelah startup selesai, keluaran berikut ditampilkan:
✔ Network docker_default Created 0.1s ✔ Network docker_ssrf_proxy_network Created 0.1s ✔ Container docker-sandbox-1 Started 0.8s ✔ Container docker-redis-1 Started 1.0s ✔ Container docker-ssrf_proxy-1 Started 1.3s ✔ Container docker-web-1 Started 1.0s ✔ Container docker-db-1 Started 0.9s ✔ Container docker-plugin_daemon-1 Started 2.4s ✔ Container docker-api-1 Started 2.4s ✔ Container docker-worker-1 Started 2.3s ✔ Container docker-nginx-1 Started 3.8s
Langkah 3: Konfigurasikan aturan akses grup keamanan
Untuk mengakses antarmuka manajemen Dify dari internet, Anda harus membuka port yang sesuai di grup keamanan ECS.
Di Konsol ECS, klik untuk instans target.
Konfigurasikan aturan grup keamanan dengan mengatur Authorization Policy ke Allow dan Protocol Type ke Web HTTP Traffic Access. Di bidang Access Destination (This Instance), masukkan port layanan Dify (80 secara default) dan tambahkan port tersebut, seperti yang ditunjukkan pada gambar berikut.

Klik OK untuk menyimpan aturan grup keamanan.
Langkah 4: Akses antarmuka manajemen Dify
Di browser, navigasikan ke http://server_ip, di mana server_ip adalah alamat IP publik instans ECS Anda. Pertama kali Anda mengakses halaman ini, Anda akan dialihkan ke halaman inisialisasi. Ikuti petunjuk untuk menyiapkan akun administrator. Setelah penyiapan selesai, sistem akan otomatis masuk.

Bangun aplikasi RAG dan verifikasi hasilnya
Langkah 1: Konfigurasikan layanan model dan kunci API
Aplikasi RAG memerlukan model bahasa besar untuk memahami pertanyaan dan menghasilkan jawaban. Ini juga membutuhkan model penyematan untuk mengonversi teks menjadi representasi vektor.
Instal penyedia model dan konfigurasikan kunci API-nya.
Di halaman utama Dify, klik foto profil Anda, lalu klik Settings dari menu drop-down.
Di halaman Pengaturan, klik Model Providers. Pilih Qwen dan klik Install.
Setelah instalasi selesai, klik Settings di daftar model yang menunggu konfigurasi.

Ikuti instruksi di halaman untuk mendapatkan API Key untuk Alibaba Cloud Model Studio dan selesaikan konfigurasi. Lalu, klik Save.

Konfigurasikan model sistem default.
Di halaman Penyedia Model, di sebelah kanan Model List, klik System Model Settings.
Atur model sesuai dengan rekomendasi berikut. Anda juga dapat memilih model lain sesuai kebutuhan.
Untuk System Reasoning Model, pilih qwen3-max-preview.
Untuk Embedding Model, pilih text-embedding-v4.
Untuk Rerank Model, pilih gte-rerank-v2.
Untuk Speech-to-text Model, pilih paraformer-realtime-v2.
Untuk Text-to-Speech Model, pilih tts-1.
Setelah Anda mengonfigurasi model, klik ESC untuk kembali ke halaman utama Dify.
Langkah 2: Buat basis pengetahuan
Basis pengetahuan adalah komponen inti dari aplikasi RAG. Ini menyimpan dokumen perusahaan dan menyediakan kemampuan pengambilan cerdas. Dokumen secara otomatis dibagi, dijadikan vektor, dan disimpan di Tablestore.
Di halaman utama Dify, klik Knowledge, lalu klik Create Knowledge.

Klik Create an Empty Knowledge Base. Di kotak dialog Create an Empty Knowledge Base, masukkan nama untuk basis pengetahuan, seperti Tablestore, dan klik Create.

Di halaman detail basis pengetahuan, klik Add File, pilih file contoh Model_Studio_Series_Mobile_Phone_Product_Introduction.docx, dan klik Next untuk melanjutkan ke pengaturan Segmentasi Teks dan Pembersihan.

Untuk mengonfigurasi parameter pemrosesan pengetahuan, atur Indexing Method ke High Quality dan Retrieval Settings ke Hybrid Search. Lalu, klik Save And Process. Anda dapat mengklik Go To Documents untuk melihat status pemrosesan dokumen yang diunggah.

Anda dapat menavigasi ke Konsol Tablestore untuk melihat data pengetahuan yang disimpan di database vektor.

Langkah 3: Buat asisten obrolan AI dan verifikasi efek RAG
Terakhir, buat aplikasi asisten obrolan. Bandingkan responsnya sebelum dan sesudah menambahkan basis pengetahuan untuk memverifikasi kemampuan pengambilan yang diperkaya dari aplikasi RAG.
Di halaman utama Dify, klik Studio lalu Create From Blank.

Pilih templat Beginner-friendly dan tipe aplikasi Chat Assistant, masukkan nama aplikasi, dan klik Create.

Uji asisten obrolan dengan mengajukan pertanyaan, seperti
Apa saja model ponsel Model Studio. Jawaban asisten mungkin belum akurat atau rinci pada tahap ini.
Di halaman Orchestration, klik Add di sebelah Knowledge Base, pilih basis pengetahuan Anda, lalu klik Restart saat diminta untuk mereset area debug.

Ajukan pertanyaan yang sama lagi kepada asisten obrolan. Dengan konten dari basis pengetahuan, asisten sekarang dapat memberikan jawaban yang akurat dan rinci.

Penggunaan dalam lingkungan produksi
Praktik terbaik
Untuk memastikan ketersediaan tinggi untuk aplikasi Dify Anda dalam lingkungan produksi, kami merekomendasikan untuk menerapkannya menggunakan ACK. Untuk informasi lebih lanjut tentang rencana implementasi, lihat solusi Cepat deploy Dify untuk mempercepat pengembangan aplikasi AI dan pilih opsi penyebaran lingkungan produksi yang menggunakan ACK.
Pencegahan risiko
Kontrol Izin: Gunakan Pengguna Manajemen Akses Sumber Daya (RAM) untuk mengelola akses sumber daya. Kontrol ketat ruang lingkup izin dan berikan hanya izin operasi yang diperlukan untuk Tablestore dan ECS.
Audit Operasi: Aktifkan ActionTrail untuk mencatat log operasi lengkap untuk akses dan modifikasi sumber daya utama. Ini memastikan bahwa semua tindakan dapat dilacak.
Cadangan Data: Secara berkala lakukan cadangan data untuk Tablestore. Ini secara efektif mencegah risiko kehilangan data yang disebabkan oleh kegagalan tak terduga atau kesalahan manusia.
Bersihkan sumber daya
Setelah Anda menyelesaikan tutorial, lepaskan sumber daya cloud terkait dengan segera untuk menghindari biaya yang tidak perlu jika Anda tidak berencana menggunakannya dalam lingkungan produksi.
Lepaskan Instans ECS
Di Konsol ECS, temukan instans target, dan klik . Ikuti petunjuk di layar untuk melepaskan instans.
Hapus Tabel Data Tablestore
Pergi ke Konsol Tablestore. Di Instance List, klik alias instans target. Di halaman Instance Management, klik Index Management untuk tabel data target. Di halaman Index Management, hapus indeks pencarian. Lalu, kembali ke daftar tabel data. Untuk tabel data target, klik .
Lepaskan Instans Tablestore (mode CU)
Pergi ke Konsol Tablestore. Di Instance List, temukan instans target dan klik Release di kolom Tindakan.
Klik OK untuk melepaskan instans. Jika Anda diminta untuk verifikasi identitas, ikuti petunjuk di layar.