全部产品
Search
文档中心

Alibaba Cloud Model Studio:Basis pengetahuan

更新时间:Nov 25, 2025

Model bahasa besar (LLM) tidak memiliki pengetahuan privat, dan pengetahuan umumnya bisa kedaluwarsa. Industri umumnya menggunakan teknologi Generasi yang Diperkaya dengan Pengambilan Data (Retrieval-Augmented Generation/RAG) untuk mengambil informasi relevan dari sumber eksternal berdasarkan input pengguna. Konten yang diambil ini kemudian digabungkan dengan kueri pengguna dan diberikan ke LLM guna menghasilkan jawaban yang lebih akurat. Fitur basis pengetahuan—kemampuan RAG dari Model Studio—secara efektif melengkapi pengetahuan privat dan menyediakan informasi terkini.

Penting

Aplikasi tanpa basis pengetahuan khusus

Tanpa basis pengetahuan khusus, LLM tidak dapat menjawab pertanyaan tentang domain tertentu secara akurat.

无

Aplikasi dengan basis pengetahuan khusus

Dengan basis pengetahuan khusus, LLM dapat menjawab pertanyaan tentang domain tertentu secara akurat.

有

Ketersediaan model

Anda dapat menggunakan basis pengetahuan dengan model-model berikut. Siapkan basis pengetahuan Qwen

  • Qwen-Max/Plus/Turbo

  • QwenVL-Max/Plus

  • Qwen (Qwen2.5, dll.)

Daftar di atas dapat diperbarui sewaktu-waktu. Rujuk ke model yang tersedia di halaman Aplikasi Saya saat Anda membuat aplikasi untuk daftar terkini.

Memulai

Bagian ini menjelaskan cara membangun aplikasi Tanya Jawab LLM yang dapat menjawab pertanyaan tentang domain tertentu (dalam hal ini, "ponsel Bailian" fiktif) tanpa menulis kode apa pun.

1. Bangun basis pengetahuan

  1. Buka halaman Basis Pengetahuan dan klik Create Knowledge Base. Masukkan Name, biarkan pengaturan lainnya pada nilai default, lalu klik Next Step.

  2. Pilih Default Category dan unggah file Spesifikasi Ponsel Bailian.docx. Klik Next Step, lalu klik Import.

2. Integrasi dengan aplikasi bisnis

Setelah membuat basis pengetahuan, Anda dapat mengaitkannya dengan aplikasi tertentu (yang harus berada dalam ruang kerja yang sama dengan basis pengetahuan) atau aplikasi eksternal untuk memproses permintaan pengambilan data.

Integrasi dengan aplikasi agen

  1. Buka halaman Aplikasi Saya, temukan aplikasi agen target, lalu klik Configure pada kartunya. Kemudian, pilih model untuk aplikasi tersebut.

    image

  2. Klik tombol + di sebelah kanan Document untuk menambahkan basis pengetahuan yang Anda buat pada langkah sebelumnya. Anda dapat mempertahankan nilai default untuk ambang batas kemiripan dan bobot.

    (Opsional) Ambang batas kemiripan: Menyaring hasil pengambilan data

    Basis pengetahuan menggunakan pencarian semantik untuk menemukan teks dalam data atau file privat Anda yang relevan dengan maksud kueri, meskipun kata kuncinya sama sekali berbeda.

    Contohnya, pengguna menanyakan: Ponsel Bailian mana yang bagus untuk fotografi?

    Namun, jawaban sebenarnya (Qwen Vivid 7...) tidak mengandung kata kunci apa pun dari kueri pengguna.

    Kemiripan kata kunci dalam tabel di bawah dihitung berdasarkan indeks Jaccard, dan kemiripan semantik berdasarkan Kemiripan Cosinus yang dihitung oleh text-embedding-v4

    Teks yang diambil

    Kemiripan kata kunci

    Kemiripan semantik

    Qwen Vivid 7: Pengalaman baru dalam fotografi cerdas

    0

    0,43

    Bailian Ace Ultra: Pilihan untuk gamer

    0,17

    0,32

    Bailian Flex Fold+: Era baru layar lipat

    0,25

    0,24

    Ambang batas kemiripan: Hanya teks dengan skor kemiripan semantik yang lebih tinggi dari nilai ini yang diambil. Jika nilai ini terlalu tinggi, basis pengetahuan akan membuang semua teks yang relevan.

    (Opsional) Bobot: Mempengaruhi urutan pengambilan data untuk beberapa basis pengetahuan

    Saat aplikasi agen dikaitkan dengan beberapa basis pengetahuan, Anda dapat memberikan bobot pada setiap basis pengetahuan berdasarkan pentingnya sumber informasi. Selama recall multi-saluran, jika beberapa basis pengetahuan berisi segmen teks yang relevan, sistem memprioritaskan segmen teks dari basis pengetahuan dengan bobot lebih tinggi.

    • Batasan utama: Bobot hanya berlaku antar basis pengetahuan dengan tipe yang sama. Misalnya, bobot basis pengetahuan Pencarian Dokumen tidak memengaruhi urutan pengambilan data basis pengetahuan Kueri Data, dan sebaliknya.

    • Cara kerja: Sistem pertama-tama menghitung relevansi pertanyaan pengguna terhadap konten di setiap basis pengetahuan dan menyaring segmen teks yang paling relevan. Kemudian, sistem mengalikan skor kemiripan setiap segmen teks dengan bobot basis pengetahuan yang sesuai. Setelah menyusun ulang hasil berdasarkan skor berbobot ini, sistem memberikannya ke LLM sebagai referensi saat menghasilkan jawaban. Segmen dengan skor berbobot lebih tinggi lebih mungkin digunakan.

  3. Ajukan pertanyaan di kotak input di sebelah kanan. LLM akan menggunakan basis pengetahuan yang Anda buat untuk menghasilkan jawaban.

    Contohnya: "Tolong bantu saya memilih ponsel Bailian terbaik untuk fotografi dengan harga di bawah 3.000 yuan."

Integrasi dengan aplikasi alur kerja

  1. Buka halaman Aplikasi Saya, temukan aplikasi alur kerja target, lalu klik Konfigurasi pada kartunya. Kemudian, seret node Basis Pengetahuan ke kanvas dan hubungkan setelah node Start.

  2. Konfigurasi node Basis Pengetahuan:

    1. Input: Di daftar drop-down Nilai di sebelah kanan nama variabel content, pilih Built-in Variable > query.

    2. Pilih Basis Pengetahuan: Pilih basis pengetahuan yang Anda buat pada langkah sebelumnya.

    3. Atur topK (Opsional): Ini menentukan jumlah segmen pengetahuan yang dikembalikan ke node turunan (biasanya node LLM).

      Meningkatkan nilai ini biasanya meningkatkan akurasi jawaban LLM, tetapi juga meningkatkan jumlah token input yang dikonsumsi oleh LLM.
  3. Seret node LLM ke kanvas dan hubungkan setelah node Basis Pengetahuan serta sebelum node Akhir.

  4. Konfigurasi node LLM:

    1. Di daftar Model Configuration, pilih model untuk node tersebut.

    2. Di bidang Prompt, masukkan prompt yang menginstruksikan LLM untuk menggunakan basis pengetahuan. Anda harus memasukkan / untuk menyisipkan variabel result, yang merepresentasikan hasil yang dikembalikan oleh pengambilan data basis pengetahuan.

      image

  5. Konfigurasi node Akhir: Masukkan /, lalu pilih LLM 1 > result untuk mengeluarkan hasil yang dikembalikan oleh LLM.

  6. Klik Test di pojok kanan atas halaman. Kemudian, ajukan pertanyaan di kotak input di sebelah kanan. LLM akan menggunakan basis pengetahuan yang Anda buat untuk menghasilkan jawaban.

    Contohnya: "Tolong bantu saya memilih ponsel Bailian terbaik untuk fotografi dengan harga di bawah 3.000 yuan."

Integrasi dengan aplikasi eksternal

Selain membangun aplikasi di Model Studio, Anda juga dapat menggunakan kemampuan pengambilan data basis pengetahuan sebagai layanan RAG independen. Menggunakan SDK Platform Layanan GenAI, Anda dapat dengan cepat mengintegrasikan layanan ini ke dalam aplikasi AI eksternal.

Untuk langkah integrasi terperinci, lihat Panduan API basis pengetahuan.

3. Optimalkan basis pengetahuan (Opsional)

Jika pengambilan pengetahuan tidak lengkap atau kontennya tidak akurat selama proses Tanya Jawab, lihat Optimalkan kinerja basis pengetahuan.

Panduan pengguna

Di halaman Basis Pengetahuan, Anda dapat melihat dan mengelola semua basis pengetahuan di ruang kerja saat ini.

ID Basis Pengetahuan: Nilai bidang ID pada setiap kartu basis pengetahuan. Digunakan untuk pemanggilan API dan skenario lainnya.

Buat basis pengetahuan

  1. Di halaman Basis Pengetahuan, klik Create Knowledge Base.

  2. Pilih Knowledge Base Type yang sesuai berdasarkan skenario aplikasi Anda. Satu basis pengetahuan hanya dapat mendukung satu tipe. Anda tidak dapat mengubah tipe basis pengetahuan setelah dibuat.

    • Pencarian Dokumen (untuk skenario pengambilan data)

      • Skenario:

      • Integrasi Sumber Data: Anda dapat mengunggah file lokal atau mengimpor dari Alibaba Cloud Object Storage Service (OSS).

        Instruksi pembuatan (Pencarian Dokumen)

        1. Pilih data: Tentukan sumber data (berisi file atau konten) untuk basis pengetahuan. Konten sumber data diimpor ke basis pengetahuan untuk pengambilan data selanjutnya. Dua metode didukung: Unggah Lokal dan Impor Cloud (memilih kategori atau file yang sudah ada).

          • Unggah Lokal: Unggah file langsung dari komputer Anda. Perluas panel yang dapat dilipat di bawah untuk mempelajari cara memilih metode penguraian.

            Pengaturan penguraian data

            Konfigurasikan kebijakan penguraian berdasarkan kebutuhan Anda. Jika Anda tidak yakin mana yang harus dipilih, Anda dapat mempertahankan pengaturan default.

            • Digital Parsing: Tidak mendukung penguraian ilustrasi atau grafik dalam file.

            • Penguraian Cerdas: Untuk ilustrasi dalam file, parser mengidentifikasi dan mengekstrak teks dari citra serta menghasilkan ringkasan teks. Ringkasan ini, bersama dengan konten non-citra lainnya dalam file, dipecah menjadi chunk, dikonversi menjadi embedding, dan digunakan untuk pengambilan data basis pengetahuan.

            • Penguraian LLM: Jika Anda menggunakan aplikasi agen dengan model Qwen-VL, Anda dapat mengajukan pertanyaan tentang konten ilustrasi dan grafik dalam file. Untuk mengaktifkan pengenalan dan pemahaman ilustrasi dan grafik dalam file, pilih LLM Parsing.

            • Penguraian Qwen VL: Metode ini khusus untuk file citra. Anda dapat menentukan model Qwen-VL dan memberikan prompt untuk memandu pengenalan dan ekstraksi tata letak serta elemen citra.

            image

            image

          • Impor Cloud: Impor file yang sudah ada dari data aplikasi atau Object Storage Service (OSS). Untuk instruksi terperinci, lihat Impor data.

        2. Konfigurasi indeks: Menentukan cara data yang diimpor diproses dan disimpan, yang secara langsung memengaruhi kinerja pengambilan data.

          Di antara item konfigurasi berikut, hanya "Penyimpanan vektor" yang mungkin dikenai biaya jika Anda memilih ADB-PG. Semua konfigurasi lainnya gratis.

          Ekstraksi metadata

          Metadata adalah seperangkat properti tambahan yang terkait dengan data tidak terstruktur. Properti ini diintegrasikan ke dalam segmen teks sebagai pasangan kunci-nilai.

          • Tujuan: Metadata menyediakan informasi kontekstual penting untuk segmen teks dan dapat secara signifikan meningkatkan akurasi pengambilan data basis pengetahuan. Misalnya, bayangkan basis pengetahuan yang berisi ribuan file pengenalan produk, di mana nama file adalah nama produk. Saat pengguna mencari "gambaran umum fungsi Produk A", jika isi setiap file berisi "gambaran umum fungsi" tetapi tidak menyebutkan "Produk A", basis pengetahuan mungkin mengambil banyak segmen teks yang tidak relevan. Namun, jika nama produk ditambahkan sebagai metadata ke semua segmen teks, basis pengetahuan dapat secara akurat menyaring segmen teks yang terkait dengan "Produk A" yang juga berisi "gambaran umum fungsi". Ini meningkatkan akurasi pengambilan data dan mengurangi jumlah token input yang dikonsumsi oleh model.

          • Penggunaan: Saat Anda memanggil aplikasi menggunakan API, Anda dapat menentukan metadata dalam parameter permintaan metadata_filter. Saat mengambil data dari basis pengetahuan, aplikasi pertama-tama menyaring file yang relevan berdasarkan metadata.

          • Catatan: Setelah basis pengetahuan dibuat, Anda tidak dapat mengonfigurasi ekstraksi metadata.

          Cara mengonfigurasi metadata

          Aktifkan Metadata Extraction, lalu klik Settings untuk menambahkan metadata terpadu atau personal ke semua file dalam basis pengetahuan. Selama pemisahan chunk, metadata setiap file diintegrasikan ke dalam segmen teksnya masing-masing. Gambar di bawah menunjukkan templat informasi meta yang digunakan dalam contoh di atas:

          image

          Instruksi untuk membuat templat informasi meta

          Metode ekstraksi nilai:

          • Konstan: Menambahkan properti tetap ke semua file dalam basis pengetahuan.

            Seperti yang ditunjukkan pada contoh di atas, jika semua file dalam basis pengetahuan memiliki penulis yang sama, Anda dapat secara seragam menetapkan bidang konstan bernama author.
          • Variabel: Menambahkan properti variabel ke setiap file dalam basis pengetahuan. Properti yang didukung saat ini termasuk file_name dan cat_name. Saat Anda memilih file_name, Model Studio menambahkan nama file ke metadatanya, seperti yang ditunjukkan pada contoh di atas. Saat Anda memilih cat_name, Model Studio menambahkan nama kategori tempat file berada ke metadata file.

          • LLM: Sistem mencocokkan konten teks setiap file dalam basis pengetahuan sesuai dengan aturan Entity Description yang ditentukan. Sistem secara otomatis mengidentifikasi dan mengekstrak informasi yang relevan dari file dan menambahkan informasi ini sebagai properti ke metadata file.

            Seperti yang ditunjukkan pada templat informasi meta dalam contoh di atas, untuk mengekstrak semua tahun yang disebutkan dalam setiap file sebagai properti file, Anda dapat menetapkan bidang LLM bernama date dengan konfigurasi deskripsi entitas berikut:

            image

          • Ekspresi reguler: Sistem mencocokkan konten teks setiap file dalam basis pengetahuan sesuai dengan ekspresi reguler yang ditentukan. Konten yang cocok dengan ekspresi diekstrak dan ditambahkan sebagai properti ke metadata file.

            Seperti yang ditunjukkan pada templat informasi meta dalam contoh di atas, untuk mengekstrak semua referensi yang disebutkan dalam setiap file, dengan asumsi referensi mengikuti pola dimulai dengan " dan diakhiri dengan ", Anda dapat menetapkan bidang ekspresi reguler bernama reference dengan konfigurasi ekspresi reguler berikut:

            image

          • Pencarian kata kunci: Sistem mencari kata kunci yang telah ditentukan dalam setiap file dan menambahkan kata kunci yang ditemukan sebagai properti ke metadata file tersebut.

            Sebagai contoh, dalam templat informasi meta dari contoh di atas, kata kunci yang telah ditentukan adalah:

            image

            Namun, karena hanya kata kunci "financing", "industry", "green", dan "capital" yang muncul dalam file ini, sistem hanya mengekstrak keempat kata kunci ini sebagai nilai untuk properti keywords file tersebut.

          Digunakan untuk Pengambilan Data: Saat diaktifkan, bidang dan nilai metadata disertakan dalam pengambilan data basis pengetahuan bersama dengan konten segmen teks. Saat dinonaktifkan, hanya konten segmen teks yang digunakan untuk pengambilan data.

          Digunakan untuk Balasan Model: Saat diaktifkan, bidang dan nilai metadata disertakan dalam proses pembuatan respons LLM bersama dengan konten segmen teks. Saat dinonaktifkan, hanya konten segmen teks yang digunakan untuk proses pembuatan respons LLM.

          Rakit header Excel

          Saat diaktifkan, basis pengetahuan memperlakukan baris pertama semua file format XLSX dan XLS sebagai header tabel dan secara otomatis menambahkannya ke setiap segmen teks (baris data). Ini mencegah LLM salah menganggap header sebagai baris data biasa.

          Jika basis pengetahuan berisi file dalam format lain, seperti PDF, Anda tidak perlu mengaktifkan pengaturan ini.

          Metode pemisahan chunk

          Pilih Intelligent Splitting (Direkomendasikan).

          Tujuan: Basis pengetahuan membagi file menjadi segmen teks (chunk) dan mengonversi chunk ini menjadi vektor menggunakan model vektor. Segmen teks dan vektor yang sesuai kemudian disimpan sebagai pasangan kunci-nilai dalam database vektor. Setelah basis pengetahuan dibuat, Anda dapat melihat atau mengedit konten spesifik (teks dan citra) setiap segmen teks.
          Catatan: Setelah basis pengetahuan dibuat, Anda tidak dapat mengubah metode pemisahan dokumen. Kebijakan pemisahan chunk yang tidak sesuai dapat mengurangi kinerja pengambilan data dan recall.

          Penulisan ulang percakapan multi-putaran

          Saat fitur ini diaktifkan, sistem memanggil model ringan khusus untuk menulis ulang pertanyaan pengguna saat ini menjadi kueri baru yang independen dan lengkap secara kontekstual dengan memasukkan riwayat percakapan. Kueri baru ini kemudian digunakan untuk pengambilan data basis pengetahuan.

          Model embedding

          Model embedding mengonversi prompt input asli dan teks pengetahuan menjadi embedding numerik untuk menghitung kemiripan semantiknya.Model default (yang tidak dapat diubah) mendukung berbagai bahasa selain Tionghoa dan Inggris serta menormalisasi vektor hasilnya.

          Dimensi vektor yang dihasilkan oleh model vektor berbeda dalam basis pengetahuan:

          Dimensi vektor berikut tidak dapat diubah.
          • text-embedding-v2: 1.536 dimensi

          Model penyusunan ulang

          Model penyusunan ulang melakukan peringkat sekunder pada segmen kandidat yang awalnya diambil oleh pencarian vektor dan mengembalikan segmen teks top-K dengan skor kemiripan tertinggi. Model Official Ranking (direkomendasikan) menggabungkan relevansi semantik dengan algoritma pencocokan kata kunci (seperti BM25) untuk menangani kueri yang memerlukan pencocokan kata kunci yang tepat. Jika Anda hanya memerlukan peringkat semantik, pilih model GTE-ReRank.

          Ambang batas kemiripan

          Ambang batas ini merepresentasikan skor kemiripan minimum untuk segmen teks agar diambil. Ambang batas ini digunakan untuk menyaring segmen teks yang dikembalikan oleh model penyusunan ulang. Hanya segmen teks dengan skor yang melebihi nilai ini yang diambil.

          Catatan

          Pengaturan ini adalah ambang batas kemiripan default untuk basis pengetahuan. Saat Anda mengaitkan basis pengetahuan dengan aplikasi tertentu, Anda juga dapat menetapkan ambang batas terpisah untuk aplikasi tersebut, yang menggantikan ambang batas default basis pengetahuan.

          Menurunkan ambang batas ini diharapkan dapat mengambil lebih banyak segmen teks, tetapi mungkin mengambil beberapa yang kurang relevan. Menaikkan ambang batas ini mengurangi jumlah segmen teks yang diambil. Jika terlalu tinggi, basis pengetahuan akan membuang segmen teks yang relevan.

          Anda dapat menggunakan pengujian hit untuk menyesuaikan ambang batas kemiripan guna menyeimbangkan tingkat recall dan presisi.

          Jumlah recall maksimum

          Anggaplah sebuah aplikasi dikaitkan dengan tiga basis pengetahuan: A1, A2, dan A3. Sistem mengambil segmen yang terkait dengan input pengguna dari basis-basis ini, menyusun ulang menggunakan model penyusunan ulang, dan memilih segmen paling relevan top-K untuk diberikan ke LLM sebagai konteks responsnya. Nilai K ini adalah Jumlah recall maksimum (hingga batas 20). Nilai ini menentukan jumlah segmen teks yang disediakan model penyusunan ulang ke LLM sebagai referensi.

          Meningkatkan nilai ini dapat meningkatkan akurasi respons LLM, tetapi juga meningkatkan jumlah token input yang dikonsumsi oleh LLM.

          Penyimpanan vektor

          Pilih database vektor untuk menyimpan vektor teks. Database vektor Platform Storage cukup untuk kebutuhan fungsional dasar basis pengetahuan. Untuk fitur lanjutan, seperti mengelola, mengaudit, atau memantau database, kami merekomendasikan memilih ADB-PG (AnalyticDB for PostgreSQL).

          Catatan bahwa saat Anda membeli instans ADB-PG, Anda harus mengaktifkan Vector Engine Optimization. Jika tidak, Model Studio tidak dapat menggunakan instans ini.
    • Kueri Data (untuk skenario Chatbot atau NL2SQL)

      • Skenario:

        • Tipe ini cocok untuk membangun sistem Tanya Jawab berdasarkan data terstruktur (data yang diorganisir dalam skema tabel yang telah ditentukan), seperti FAQ, asisten kueri data produk, atau informasi personel.

        • Jika data Anda terdiri dari pasangan Tanya Jawab FAQ lengkap, pilih Kueri Data. Misalnya, jika Anda memiliki file Excel yang berisi dua kolom, Question dan Answer, basis pengetahuan Kueri Data memungkinkan Anda hanya mengambil informasi dari kolom Question dan hanya menggunakan konten dari kolom Answer sebagai referensi untuk respons LLM.

          Basis pengetahuan Pencarian Dokumen tidak dapat dengan mudah mencapai efek ini.
        • Anda dapat mengimpor beberapa file Excel dengan skema tabel yang benar-benar identik.

      • Integrasi Sumber Data: Anda dapat mengunggah file lokal XLS atau XLSX.

        Instruksi pembuatan (Kueri Data)

        1. Pilih data: Tentukan sumber data, seperti file atau konten, untuk diimpor ke basis pengetahuan untuk pengambilan data selanjutnya.Dua metode berikut didukung: Unggah lokal dan Impor cloud (pilih tabel data yang sudah ada dari data aplikasi).

          Catatan

          Sumber data tidak dapat diubah setelah basis pengetahuan dibuat, dan satu basis pengetahuan tidak dapat mendukung beberapa sumber data secara bersamaan.

          • Unggah Lokal: Unggah tabel data (format XLS atau XLSX, dan baris pertama harus berupa header tabel) langsung dari komputer Anda.

          • Impor cloud (Pilih tabel data): Pilih tabel data yang sudah ada di aplikasi Anda. Untuk prosedurnya, lihat Impor Data.

        2. Konfigurasi indeks: Menentukan cara data yang diimpor diproses dan disimpan, yang secara langsung memengaruhi kinerja pengambilan data.

          Di antara item konfigurasi berikut, hanya "Penyimpanan vektor" yang mungkin dikenai biaya jika Anda memilih ADB-PG. Semua konfigurasi lainnya gratis.

          Berpartisipasi dalam pengambilan data/Berpartisipasi dalam respons model

          • Participate In Retrieval: Saat diaktifkan, basis pengetahuan diizinkan mencari dalam kolom data ini.

          • Include In Model Response: Saat diaktifkan, hasil pengambilan data dari kolom ini digunakan sebagai input untuk LLM menghasilkan respons. Misalnya, dalam konfigurasi yang ditunjukkan pada gambar berikut, Include In Retrieval diaktifkan untuk kolom "Nama", "Jenis Kelamin", "Posisi", dan "Usia", dan Include In Model Response diaktifkan untuk kolom "Nama" dan "Posisi". Dalam kasus ini, basis pengetahuan mengambil data dari semua kolom. Namun, hanya konten dari kolom "Nama" dan "Posisi" dari data yang diambil yang diberikan ke LLM untuk membantu menghasilkan respons.

            image

            Seperti yang ditunjukkan pada gambar di bawah, karena "Usia" tidak diaktifkan untuk berpartisipasi dalam respons model, LLM tetap tidak dapat menjawab pertanyaan "Berapa usia Zhang San?" setelah dikaitkan dengan basis pengetahuan ini.

            image

          Penulisan ulang percakapan multi-putaran

          Saat fitur ini diaktifkan, sistem memanggil model ringan khusus untuk menulis ulang pertanyaan pengguna saat ini menjadi kueri baru yang independen dan lengkap secara kontekstual dengan memasukkan riwayat percakapan. Kueri baru ini kemudian digunakan untuk pengambilan data basis pengetahuan.

          Model embedding

          Model embedding mengonversi prompt input asli dan teks pengetahuan menjadi embedding numerik untuk menghitung kemiripan semantiknya.Model default (yang tidak dapat diubah) mendukung berbagai bahasa selain Tionghoa dan Inggris serta menormalisasi vektor hasilnya.

          Dimensi vektor yang dihasilkan oleh model vektor berbeda dalam basis pengetahuan:

          Dimensi vektor berikut tidak dapat diubah.
          • text-embedding-v2: 1.536 dimensi

          Model penyusunan ulang

          Model penyusunan ulang melakukan peringkat sekunder pada segmen kandidat yang awalnya diambil oleh pencarian vektor dan mengembalikan segmen teks top-K dengan skor kemiripan tertinggi. Model Official Ranking (direkomendasikan) menggabungkan relevansi semantik dengan algoritma pencocokan kata kunci (seperti BM25) untuk menangani kueri yang memerlukan pencocokan kata kunci yang tepat. Jika Anda hanya memerlukan peringkat semantik, pilih model GTE-ReRank.

          Ambang batas kemiripan

          Ambang batas ini merepresentasikan skor kemiripan minimum untuk segmen teks agar diambil. Ambang batas ini digunakan untuk menyaring segmen teks yang dikembalikan oleh model penyusunan ulang. Hanya segmen teks dengan skor yang melebihi nilai ini yang diambil.

          Catatan

          Pengaturan ini adalah ambang batas kemiripan default untuk basis pengetahuan. Saat Anda mengaitkan basis pengetahuan dengan aplikasi tertentu, Anda juga dapat menetapkan ambang batas terpisah untuk aplikasi tersebut, yang menggantikan ambang batas default basis pengetahuan.

          Menurunkan ambang batas ini diharapkan dapat mengambil lebih banyak segmen teks, tetapi mungkin mengambil beberapa yang kurang relevan. Menaikkan ambang batas ini mengurangi jumlah segmen teks yang diambil. Jika terlalu tinggi, basis pengetahuan akan membuang segmen teks yang relevan.

          Anda dapat menggunakan pengujian hit untuk menyesuaikan ambang batas kemiripan guna menyeimbangkan tingkat recall dan presisi.

          Jumlah recall maksimum

          Anggaplah sebuah aplikasi dikaitkan dengan tiga basis pengetahuan: A1, A2, dan A3. Sistem mengambil segmen yang terkait dengan input pengguna dari basis-basis ini, menyusun ulang menggunakan model penyusunan ulang, dan memilih segmen paling relevan top-K untuk diberikan ke LLM sebagai konteks responsnya. Nilai K ini adalah Jumlah recall maksimum (hingga batas 20). Nilai ini menentukan jumlah segmen teks yang disediakan model penyusunan ulang ke LLM sebagai referensi.

          Meningkatkan nilai ini dapat meningkatkan akurasi respons LLM, tetapi juga meningkatkan jumlah token input yang dikonsumsi oleh LLM.

          Penyimpanan vektor

          Pilih database vektor untuk menyimpan vektor teks. Database vektor Platform Storage cukup untuk kebutuhan fungsional dasar basis pengetahuan. Untuk fitur lanjutan, seperti mengelola, mengaudit, atau memantau database, kami merekomendasikan memilih ADB-PG (AnalyticDB for PostgreSQL).

          Catatan bahwa saat Anda membeli instans ADB-PG, Anda harus mengaktifkan Vector Engine Optimization. Jika tidak, Model Studio tidak dapat menggunakan instans ini.
    • Tanya Jawab Citra (untuk skenario pencarian berdasarkan citra)

      • Skenario:

        • Tipe ini cocok untuk membangun aplikasi pengambilan data multimodal seperti pencarian berdasarkan citra dan pencarian berdasarkan citra ditambah teks, seperti panduan belanja produk atau asisten Tanya Jawab Citra.

      • Sumber Data: Anda dapat mengunggah file lokal XLS atau XLSX.

        File XLS dan XLSX harus berisi URL citra yang dapat diakses publik untuk membangun indeks citra. Untuk detailnya, lihat instruksi pembuatan di bawah.

        Instruksi pembuatan (Tanya Jawab Citra)

        1. Pilih data: Tentukan sumber data, seperti file atau konten, untuk basis pengetahuan. Konten dari sumber data diimpor ke basis pengetahuan untuk pengambilan data selanjutnya.Dua metode berikut didukung: unggah lokal dan impor cloud (pilih tabel data yang sudah ada dari data aplikasi).

          Catatan

          Sumber data tidak dapat diubah setelah basis pengetahuan dibuat, dan satu basis pengetahuan tidak dapat mendukung beberapa sumber data secara bersamaan.

          • Unggah Lokal: Unggah tabel data (format XLS atau XLSX) langsung dari komputer Anda.

            Catatan
            • Bidang: Tabel data harus berisi setidaknya satu bidang bertipe image_url untuk menghasilkan indeks citra.

            • Proses pembuatan: Basis pengetahuan mengakses URL citra dalam bidang image_url, mengekstrak fitur visual, dan mengonversinya menjadi vektor yang disimpan.

            • Proses pengambilan data: Basis pengetahuan membandingkan vektor yang dihasilkan dari citra yang diunggah pengguna dengan vektor citra yang disimpan untuk kemiripan dan mengembalikan catatan yang paling relevan.

          • Impor cloud (pilih tabel data): Pilih tabel data yang sudah ada dari data aplikasi di Model Studio. Untuk informasi lebih lanjut, lihat Impor Data.

        2. Konfigurasi indeks: Menentukan cara data yang diimpor diproses dan disimpan, yang secara langsung memengaruhi kinerja pengambilan data.

          Di antara item konfigurasi berikut, hanya "Penyimpanan vektor" yang mungkin dikenai biaya jika Anda memilih ADB-PG. Semua konfigurasi lainnya gratis.

          Berpartisipasi dalam pengambilan data/Berpartisipasi dalam respons model

          • Participate In Retrieval: Saat diaktifkan, basis pengetahuan diizinkan mencari dalam kolom data ini.

          • Include In Model Response: Saat diaktifkan, hasil pengambilan data dari kolom ini digunakan sebagai input untuk LLM menghasilkan respons. Misalnya, dalam konfigurasi yang ditunjukkan pada gambar berikut, Include In Retrieval diaktifkan untuk kolom "Nama", "Jenis Kelamin", "Posisi", dan "Usia", dan Include In Model Response diaktifkan untuk kolom "Nama" dan "Posisi". Dalam kasus ini, basis pengetahuan mengambil data dari semua kolom. Namun, hanya konten dari kolom "Nama" dan "Posisi" dari data yang diambil yang diberikan ke LLM untuk membantu menghasilkan respons.

            image

            Seperti yang ditunjukkan pada gambar di bawah, karena "Usia" tidak diaktifkan untuk berpartisipasi dalam respons model, LLM tetap tidak dapat menjawab pertanyaan "Berapa usia Zhang San?" setelah dikaitkan dengan basis pengetahuan ini.

            image

          Penulisan ulang percakapan multi-putaran

          Saat fitur ini diaktifkan, sistem memanggil model ringan khusus untuk menulis ulang pertanyaan pengguna saat ini menjadi kueri baru yang independen dan lengkap secara kontekstual dengan memasukkan riwayat percakapan. Kueri baru ini kemudian digunakan untuk pengambilan data basis pengetahuan.

          Model vektor

          Model vektor mengonversi Prompt input asli, teks pengetahuan, dan citra menjadi vektor numerik untuk perbandingan kemiripan. Model default embedding multimodal v1 (multimodal-embedding-v1) (yang tidak dapat diubah) mendukung bahasa Tionghoa dan Inggris serta berbagai format citra dan video, menormalisasi hasil vektor, dan cocok untuk sebagian besar skenario. Untuk informasi lebih lanjut, lihat Embedding Teks dan Multimodal.

          Model penyusunan ulang

          Model penyusunan ulang melakukan peringkat sekunder pada segmen kandidat yang awalnya diambil oleh pencarian vektor dan mengembalikan segmen teks top-K dengan skor kemiripan tertinggi. Model Official Ranking (direkomendasikan) menggabungkan relevansi semantik dengan algoritma pencocokan kata kunci (seperti BM25) untuk menangani kueri yang memerlukan pencocokan kata kunci yang tepat. Jika Anda hanya memerlukan peringkat semantik, pilih model GTE-ReRank.

          Ambang batas kemiripan

          Ambang batas ini merepresentasikan skor kemiripan minimum untuk segmen teks agar diambil. Ambang batas ini digunakan untuk menyaring segmen teks yang dikembalikan oleh model penyusunan ulang. Hanya segmen teks dengan skor yang melebihi nilai ini yang diambil.

          Catatan

          Pengaturan ini adalah ambang batas kemiripan default untuk basis pengetahuan. Saat Anda mengaitkan basis pengetahuan dengan aplikasi tertentu, Anda juga dapat menetapkan ambang batas terpisah untuk aplikasi tersebut, yang menggantikan ambang batas default basis pengetahuan.

          Menurunkan ambang batas ini diharapkan dapat mengambil lebih banyak segmen teks, tetapi mungkin mengambil beberapa yang kurang relevan. Menaikkan ambang batas ini mengurangi jumlah segmen teks yang diambil. Jika terlalu tinggi, basis pengetahuan akan membuang segmen teks yang relevan.

          Anda dapat menggunakan pengujian hit untuk menyesuaikan ambang batas kemiripan guna menyeimbangkan tingkat recall dan presisi.

          Jumlah recall maksimum

          Anggaplah sebuah aplikasi dikaitkan dengan tiga basis pengetahuan: A1, A2, dan A3. Sistem mengambil segmen yang terkait dengan input pengguna dari basis-basis ini, menyusun ulang menggunakan model penyusunan ulang, dan memilih segmen paling relevan top-K untuk diberikan ke LLM sebagai konteks responsnya. Nilai K ini adalah Jumlah recall maksimum (hingga batas 20). Nilai ini menentukan jumlah segmen teks yang disediakan model penyusunan ulang ke LLM sebagai referensi.

          Meningkatkan nilai ini dapat meningkatkan akurasi respons LLM, tetapi juga meningkatkan jumlah token input yang dikonsumsi oleh LLM.

          Penyimpanan vektor

          Pilih database vektor untuk menyimpan vektor teks. Database vektor Platform Storage cukup untuk kebutuhan fungsional dasar basis pengetahuan. Untuk fitur lanjutan, seperti mengelola, mengaudit, atau memantau database, kami merekomendasikan memilih ADB-PG (AnalyticDB for PostgreSQL).

          Catatan bahwa saat Anda membeli instans ADB-PG, Anda harus mengaktifkan Vector Engine Optimization. Jika tidak, Model Studio tidak dapat menggunakan instans ini.
  3. Selama jam sibuk, seluruh proses pembuatan mungkin memakan waktu beberapa jam, tergantung pada volume data. Harap bersabar.

Perbarui basis pengetahuan

Setiap perubahan pada konten basis pengetahuan disinkronkan secara real time ke semua aplikasi yang mereferensinya.

Basis pengetahuan Pencarian Dokumen

  • Pembaruan otomatis (Direkomendasikan)

    Anda dapat mencapai ini dengan mengintegrasikan API untuk OSS, FC, dan basis pengetahuan Model Studio. Ikuti langkah-langkah sederhana berikut:

    1. Buat bucket: Buka Konsol OSS dan buat Bucket OSS untuk menyimpan file asli Anda.

    2. Buat basis pengetahuan: Buat basis pengetahuan tidak terstruktur untuk menyimpan konten pengetahuan privat.

    3. Buat fungsi yang didefinisikan pengguna: Buka Konsol FC dan buat fungsi untuk event perubahan file, seperti pembuatan dan penghapusan file. Untuk informasi lebih lanjut, lihat Buat fungsi. Fungsi-fungsi ini menyinkronkan perubahan file di OSS ke basis pengetahuan yang dibuat dengan memanggil API terkait dari Panduan API basis pengetahuan.

    4. Buat pemicu OSS: Di FC, kaitkan pemicu OSS dengan fungsi yang didefinisikan pengguna yang Anda buat pada langkah sebelumnya. Saat event perubahan file terdeteksi (misalnya, saat file baru diunggah ke OSS), pemicu yang sesuai diaktifkan, yang memicu FC untuk mengeksekusi fungsi yang sesuai.

  • Pembaruan manual

    Di halaman Basis pengetahuan, temukan basis pengetahuan target, lalu klik View Details pada kartunya.

    • Cara menambahkan file baru: Klik Upload Data dan pilih file yang sudah ada di data aplikasi. Untuk informasi lebih lanjut, lihat Cara mengunggah file ke data aplikasi.

    • Cara menghapus file: Temukan file target dan klik Delete di sebelah kanannya.

      Operasi ini hanya menghapus file dari basis pengetahuan dan tidak menghapus file sumber di Data Aplikasi.
    • Cara memodifikasi konten file: Pembaruan di tempat dan unggahan penggantian tidak didukung. Anda harus terlebih dahulu menghapus versi lama file dari basis pengetahuan, lalu mengimpor kembali versi baru yang telah dimodifikasi.

      Catatan: Menyimpan versi lama file dapat menyebabkan konten kedaluwarsa diambil dan di-recall.

Basis pengetahuan Kueri Data dan Tanya Jawab Citra

  • Pembaruan otomatis

    Tidak didukung.

  • Pembaruan manual

    Saat sumber data basis pengetahuan adalah tabel data di Data Aplikasi, pembaruannya hanya dapat dilakukan secara manual. Prosesnya melibatkan dua langkah.

    1. Langkah 1: Perbarui tabel data

      Buka tab Data Aplikasi. Di daftar sebelah kiri, pilih tabel data target, lalu klik Import Data.

      • Cara menyisipkan data baru: Atur Jenis Impor ke Incremental Upload. Anda perlu mengunggah file Excel yang hanya berisi header tabel dan baris data baru.

        Header file harus sesuai dengan skema tabel saat ini. Anda dapat menggunakan fitur Download Template di halaman untuk mendapatkan file header standar dan mengisi data baru secara langsung.
      • Cara menghapus data: Atur Jenis Impor ke Upload and Overwrite. Anda perlu mengunggah file Excel yang berisi header dan data lengkap terbaru (dengan catatan yang akan dihapus dihilangkan).

        Cara mendapatkan data lengkap: Klik ikon image di halaman untuk mengunduh data dalam format XLSX.
      • Cara memodifikasi data: Atur Jenis Impor ke Upload and Overwrite. Anda perlu mengunggah file Excel yang berisi header dan data lengkap terbaru (termasuk modifikasi yang sesuai).

    2. Langkah 2: Sinkronkan perubahan ke basis pengetahuan

      Kembali ke daftar Basis Pengetahuan, temukan basis pengetahuan target, lalu klik View Details pada kartunya. Klik ikon image di pojok kiri atas tabel data. Setelah Anda mengonfirmasi operasi, konten terbaru tabel data disinkronkan ke basis pengetahuan.

      Anda masih perlu mengulangi langkah-langkah di atas secara manual setelah setiap pembaruan berikutnya. Perubahan data tidak dapat disinkronkan secara otomatis untuk basis pengetahuan yang menggunakan "Data Aplikasi" sebagai sumber data.

Edit basis pengetahuan

Setelah basis pengetahuan dibuat, Anda hanya dapat memodifikasi Nama Basis Pengetahuan, Deskripsi Basis Pengetahuan, dan Ambang Batas Kemiripan. Konfigurasi lain tidak dapat diubah. Mengedit basis pengetahuan menggunakan API tidak didukung.

Prosedur: Di halaman Basis Pengetahuan, temukan basis pengetahuan target, klik ikon image pada kartunya, lalu klik Edit.

Hapus basis pengetahuan

Catatan

Operasi ini tidak menghapus file sumber atau tabel data di Data Aplikasi.

Peringatan

Operasi ini tidak dapat dibatalkan. Harap berhati-hati.

Sebelum Anda dapat menghapus basis pengetahuan, Anda harus terlebih dahulu memutuskan kaitannya dari semua aplikasi yang dipublikasikan.

Aplikasi yang tidak dipublikasikan dan dikaitkan tidak akan menghalangi operasi penghapusan.

Langkah-langkah untuk menghapus basis pengetahuan

  1. Untuk setiap aplikasi dipublikasikan yang dikaitkan dengan basis pengetahuan, lakukan operasi berikut:

    1. Di halaman Aplikasi Saya, temukan aplikasi yang dikaitkan dengan basis pengetahuan, lalu klik Configure.

    2. Hapus basis pengetahuan dari daftar basis pengetahuan. Klik Publish di pojok kanan atas halaman dan ikuti instruksi untuk menerbitkan ulang aplikasi.

    3. Ulangi langkah-langkah di atas untuk semua aplikasi yang dipublikasikan dan dikaitkan dengan basis pengetahuan.

  2. Di halaman Basis Pengetahuan, temukan basis pengetahuan target, klik ikon image pada kartu, lalu klik Delete.

Pengujian hit

Bayangkan Anda telah membangun basis pengetahuan, tetapi Anda menemukan bahwa dalam penggunaan aktual, aplikasi AI sering memberikan jawaban yang tidak relevan atau gagal menemukan informasi yang ada dalam basis pengetahuan. Pengujian hit adalah alat utama yang membantu Anda mengidentifikasi dan menyelesaikan masalah ini secara proaktif.

Dengan pengujian hit, Anda dapat:

  • Memverifikasi apakah basis pengetahuan dapat memberikan input pengetahuan yang efektif untuk aplikasi AI.

  • Menyesuaikan ambang batas kemiripan untuk menyeimbangkan tingkat recall dan akurasi.

  • Menemukan celah konten atau masalah kualitas dalam basis pengetahuan.

Contoh skenario

  • Skenario 1: Pelanggan menanyakan harga produk

    Input uji: "Berapa harga ponsel Bailian Anda?"
    Hasil yang diharapkan: Harus dapat mengambil segmen teks yang relevan yang berisi informasi harga.
  • Skenario 2: Pemecahan masalah teknis

    Input uji: "Apa yang harus saya lakukan jika perangkat saya tidak bisa terhubung ke WiFi?"
    Hasil yang diharapkan: Harus dapat mengambil segmen teks yang relevan tentang pemecahan masalah koneksi WiFi.

Prosedur

  1. Di halaman Basis Pengetahuan, temukan basis pengetahuan target, lalu klik Hit Test pada kartunya.

  2. Masukkan pertanyaan di antarmuka uji (kami merekomendasikan mengumpulkan pertanyaan pengguna yang sering diajukan terlebih dahulu) dan amati hasil pengambilan datanya.

    • Hasil pengambilan data: Hasil hit untuk kata kunci uji ini (diurutkan berdasarkan kemiripan dari yang tertinggi ke terendah). Klik segmen apa pun untuk melihat konten spesifiknya.

    • imageIkon: Untuk basis pengetahuan Tanya Jawab Citra, sistem pertama-tama mengonversi citra input menjadi vektor dan mengambil catatan yang relevan. Kemudian, sistem mengirim catatan ini bersama pertanyaan ke LLM untuk menghasilkan jawaban. Untuk basis pengetahuan Pencarian Dokumen atau Kueri Data, citra yang diunggah tidak berpartisipasi dalam pengambilan data.

  3. Konfirmasi apakah segmen teks yang relevan diambil dengan benar. Jika tidak, Anda perlu menyesuaikan ambang batas kemiripan dan mengulangi langkah sebelumnya.

  4. Klik View Historical Retrieval Records untuk membandingkan kinerja pengambilan data di bawah pengaturan ambang batas yang berbeda di masa lalu.

image

Kuota dan batasan

  • Untuk informasi tentang sumber data dan kapasitas yang didukung oleh basis pengetahuan, lihat Kuota dan batasan basis pengetahuan.

  • Setiap aplikasi dapat dikaitkan dengan maksimal 5 basis pengetahuan Pencarian Dokumen, 5 basis pengetahuan Kueri Data, dan 1 basis pengetahuan Tanya Jawab Citra.

Penagihan

Fitur basis pengetahuan gratis, tetapi Anda mungkin dikenai biaya saat memanggil aplikasi yang mereferensikan basis pengetahuan.

Langkah

Informasi penagihan

Bangun basis pengetahuan

Gratis.

Integrasi dengan aplikasi bisnis

Saat Anda memanggil aplikasi, segmen teks yang diambil dari basis pengetahuan meningkatkan jumlah token input untuk LLM. Hal ini dapat menyebabkan peningkatan biaya inferensi model (pemanggilan). Untuk detail biaya inferensi model (pemanggilan), lihat Item yang dapat ditagih.

Catatan: Jika Anda hanya mengambil dari basis pengetahuan tertentu dengan memanggil API Ambil dan tidak menggunakan aplikasi untuk generasi, Anda tidak akan dikenai biaya.

Manajemen dan O&M

Gratis.

Referensi API

FAQ

Membangun basis pengetahuan

  • T: Dapatkah file atau tabel data yang telah diimpor ke basis pengetahuan dihapus dari Data Aplikasi?

    • Basis pengetahuan Pencarian Dokumen: Ya, Anda bisa. File di Data Aplikasi dan basis pengetahuan adalah salinan data yang independen. Menghapus file sumber di Data Aplikasi tidak memengaruhi file yang sudah diimpor ke basis pengetahuan.

    • Basis pengetahuan Kueri Data dan Tanya Jawab Citra: Tidak, Anda tidak bisa. Melakukannya menyebabkan anomali dalam fungsi seperti sinkronisasi data dan melihat basis pengetahuan.

Menangani citra dan konten multimodal

  • T: File saya berisi ilustrasi yang perlu dikembalikan dalam respons aplikasi. Bagaimana cara menanganinya?

    Gunakan basis pengetahuan Pencarian Dokumen

    Metode 1 (hanya untuk aplikasi agen)

    1. Saat Anda membuat basis pengetahuan, untuk Jenis basis pengetahuan, pilih Pencarian Dokumen, dan untuk Skenario, pilih With Illustrations.

      Basis pengetahuan mengekstrak ringkasan dari ilustrasi file. LLM secara otonom memutuskan apakah akan menyisipkan citra berdasarkan relevansi ringkasan terhadap pertanyaan.

      image

    2. Saat Anda membuat atau mengedit aplikasi agen, pilih model Qwen-Plus atau Qwen-Plus-Latest (keduanya telah diuji memiliki kinerja terbaik). Klik tombol + di sebelah kanan Document dan tambahkan basis pengetahuan yang Anda buat pada langkah sebelumnya.

      Catatan: Fitur "Dengan ilustrasi" dan "Tampilkan sumber" tidak dapat diaktifkan secara bersamaan.
    3. Efek Tanya Jawab aktual:

      image

    Metode 2 (untuk aplikasi agen dan aplikasi alur kerja)

    1. Unggah citra ke lokasi yang dapat diakses publik dan dapatkan URL lengkapnya. Kami merekomendasikan menggunakan OSS. Untuk informasi lebih lanjut, lihat Unggah citra ke OSS dan gunakan URL file-nya.

    2. Sisipkan URL lengkap (jalur relatif tidak didukung) ke dalam file. Harap dicatat: Menyematkan file citra langsung ke dalam dokumen tidak didukung (misalnya, dengan menyalin dan menempel atau menyisipkan citra lokal dari menu). Anda harus menggunakan URL yang dapat diakses publik untuk mereferensikan citra.

      Jika Anda telah mengikuti instruksi tetapi citra tetap tidak ditampilkan, periksa apakah URL dalam segmen teks lengkap. Konfirmasi apakah ada spasi tambahan atau karakter khusus, yang mungkin disalahartikan oleh sistem. Jika ada masalah, Anda dapat mengedit dan memperbaikinya secara langsung.

      Contoh mereferensikan citra dengan benar dalam file

      Templat prompt contoh

      Efek Tanya Jawab aktual

      image

      # Basis Pengetahuan
      Harap ingat materi berikut, mereka mungkin membantu menjawab pertanyaan.
      ${documents}
      
      # Persyaratan
      Jika ada citra, harap tampilkan.

      image

      Contoh mereferensikan citra dengan salah dalam file

      Templat prompt contoh

      Efek Tanya Jawab aktual

      image

      # Basis Pengetahuan
      Harap ingat materi berikut, mereka mungkin membantu menjawab pertanyaan.
      ${documents}
      
      # Persyaratan
      Jika ada citra, harap tampilkan.

      image

      Penjelasan: Saat citra disisipkan langsung ke dalam file, aplikasi tidak akan menampilkan citra dalam responsnya.

    Gunakan basis pengetahuan Tanya Jawab Citra

    1. Unggah citra ke lokasi yang dapat diakses melalui internet dan dapatkan URL lengkapnya. Kami merekomendasikan menggunakan OSS. Untuk instruksi terperinci, lihat Unggah citra ke OSS dan gunakan URL file-nya.

    2. Di tab Tabel, buat tabel data baru dan tambahkan bidang image_url untuk menyimpan URL lengkap citra.

      Catatan
      • Bidang image_url tidak mendukung jalur relatif.

      • Satu bidang image_url tidak mendukung penyimpanan beberapa URL citra. Jika satu catatan perlu dikaitkan dengan beberapa citra, Anda harus membuat bidang image_url terpisah untuk setiap citra, seperti image_1 dan image_2.

      • Versi saat ini tidak mendukung penyimpanan beberapa URL citra dalam satu bidang.

      • Pastikan ukuran file citra yang ditunjuk oleh setiap image_url dalam tabel data tidak melebihi 3 MB. Melebihi batas menyebabkan pembuatan basis pengetahuan gagal.

      • Setelah tabel data dibuat, Anda tidak dapat lagi menambahkan atau memodifikasi bidang bertipe image_url. Harap siapkan semua bidang citra yang mungkin diperlukan saat awalnya merancang skema tabel.

      image

    3. Saat Anda membangun basis pengetahuan, pilih Tanya Jawab Citra sebagai Jenis Basis Pengetahuan.

    4. Saat Anda membuat atau mengedit aplikasi agen, klik tombol + di sebelah kanan Image (basis pengetahuan Tanya Jawab Citra) dan tambahkan basis pengetahuan yang Anda buat pada langkah sebelumnya. Ubah templat prompt menjadi:

      # Basis Pengetahuan
      Harap ingat materi berikut, mereka mungkin membantu menjawab pertanyaan.
      ${documents}
      
      # Persyaratan
      Jika ada citra, harap tampilkan.
    5. Selanjutnya, ajukan pertanyaan di kotak input di sebelah kanan.

      Contohnya: "Perkenalkan secara singkat ponsel Model Studio X1."

      Contoh mereferensikan citra dengan benar

      Templat prompt contoh

      Prompt pengguna dan hasil yang dikembalikan oleh aplikasi

      image

      # Basis Pengetahuan
      Harap ingat materi berikut, mereka mungkin membantu menjawab pertanyaan.
      ${documents}
      
      # Persyaratan
      Jika ada citra, harap tampilkan.

      image

Izin dan keamanan

  • T: Saat mengoperasikan basis pengetahuan, saya mengalami error "Izin untuk modul ini tidak ditemukan". Bagaimana cara menanganinya?

    Secara default, Pengguna RAM tidak dapat melakukan operasi tulis seperti membuat, memperbarui, atau menghapus basis pengetahuan. Akun Alibaba Cloud harus memberikan pengguna izin Administrator izin halaman, atau izin yang mencakup setidaknya ApplicationData-FullAccess dan KnowledgeBase-FullAccess.

  • T: Apakah basis pengetahuan bersifat privat? Dapatkah organisasi atau pengguna lain mengaksesnya?

    Basis pengetahuan dibatasi untuk anggota dalam ruang kerjanya untuk akses dan operasi. Basis pengetahuan tidak dapat diakses publik.

  • T: Apakah Alibaba Cloud akan menggunakan basis pengetahuan di bawah akun saya untuk menjawab pertanyaan pengguna lain?

    Alibaba Cloud secara ketat melindungi privasi data dan tidak akan pernah menggunakan basis pengetahuan Anda untuk menjawab pertanyaan pengguna lain atau untuk pelatihan model. Untuk detail komitmen kami terhadap keamanan dan privasi data, lihat Kebijakan privasi.

Migrasi dan ekspor

  • T: Bagaimana cara mengekspor basis pengetahuan ke mesin lokal saya?

    Ekspor satu klik tidak didukung. Sebagai alternatif, Anda dapat memperoleh data secara manual dengan cara berikut:

    • Unduh file asli atau tabel data dari Data Aplikasi.

    • Tulis skrip untuk mengambil data dokumen dan segmen secara Batch dengan memanggil <a baseurl="t2733975_v32_2_0.xdita" data-node="5041929" data-root="85177" data-tag="xref" href="t2743546.xdita#" id="eaefa2ec919gs">ListChunks</a> API.