Topik ini menjelaskan cara mentransfer data dari Alibaba Cloud Object Storage Service (OSS) ke basis pengetahuan RAGFlow Data Transmission Service (DTS).
Prasyarat
Anda telah membuat basis pengetahuan RAGFlow di DTS dan mengonfigurasi daftar putih IP.
Jenis file yang didukung
DOC, DOCX, PPT, PPTX, YML, XML, HTML, JSON, CSV, TXT, XLS, XLSX, WPS, RTF, MD, dan SQL
JPG, JPEG, dan PNG
INI
MP3
Persiapan
Buat Pasangan Kunci Akses dan catat ID AccessKey serta Rahasia AccessKey.
CatatanJika Anda menggunakan Pasangan Kunci Akses yang dibuat oleh Pengguna Resource Access Management (RAM), Pengguna RAM tersebut harus diberikan izin read-only (AliyunOSSReadOnlyAccess) atau izin manajemen (AliyunOSSFullAccess) untuk Object Storage Service (OSS).
Peroleh dan catat informasi Bucket OSS, termasuk nama bucket dan ID Wilayah.
Masuk ke Konsol OSS.
Di panel navigasi sebelah kiri, klik Buckets.
Temukan bucket tujuan.
Catat Bucket Name dari bucket target.
Catat Region dari bucket target, lalu temukan dan catat ID Wilayah-nya.
Prosedur
Peroleh file KBSync.
CatatanAnda dapat bergabung dengan grup DingTalk (ID: 79690034672) dan menghubungi helpdesk untuk memperoleh file KBSync.
Siapkan lingkungan runtime untuk program KBSync.
CatatanProgram KBSync harus berjalan di lingkungan Linux yang dapat mengakses OSS dan RAGFlow.
Siapkan file konfigurasi config.
Buat file Linux bernama config.
Salin kode berikut ke dalam file config.
whiteList= blackList= sinkType=RagFlow sourceType=OSS ragflowUrl=http://XX.XX.XX.XX ragflowApiKey=Bearer ragflow-Rh****** ragflowDatasetId=****** sourceOSSAccessKeyId=****** sourceOSSAccessKeySecret=****** sourceOSSRegion=cn-beijing sourceOSSBucket=kbsyncGanti parameter dalam file config.
PentingJika suatu parameter tidak memerlukan konfigurasi, biarkan nilainya kosong.
Parameter
blackListmemiliki prioritas lebih tinggi daripada parameterwhiteList.
Parameter
Diperlukan
Deskripsi
Cara memperoleh
whiteListTidak
Jalur file yang akan ditransfer (daftar putih) dan file yang akan dikecualikan (daftar hitam). Ini mencakup jalur folder dan dokumen di OSS.
CatatanEkspresi reguler didukung. Pisahkan beberapa jalur dengan spasi.
Peroleh dari OSS.
blackListsinkTypeYa
Jenis sink.
Nilainya harus
RagFlow.sourceTypeJenis sumber.
Nilainya harus
OSS.ragflowUrlAlamat RAGFlow (API Server).
ragflowApiKeyKunci API untuk basis pengetahuan RAGFlow.
PentingHarus dimulai dengan
Bearer, contohnya,Bearer ragflow-RhMjc0NjFhNTZmNTExZjBiYWY****.ragflowDatasetIdID basis pengetahuan RAGFlow.
sourceOSSAccessKeyIdID AccessKey yang Anda catat di bagian Persiapan.
sourceOSSAccessKeySecretRahasia AccessKey yang Anda catat di bagian Persiapan.
sourceOSSRegionID wilayah OSS yang Anda catat di bagian Persiapan.
sourceOSSBucketNama bucket OSS yang Anda catat di bagian Persiapan.
Letakkan file KBSync dan file konfigurasi config di folder yang sama di lingkungan Linux.
Di lingkungan Linux, jalankan perintah
./KBSync --config configuntuk memulai program KBSync.Jika output serupa dengan berikut ini, program KBSync berjalan dengan benar.
INFO config SourceType=OSS, SinkType=RagFlow INFO config whiteList=, blackList= INFO config ragflowUrl=http://XX.XX.XX.XX ragflowApiKey=Bearer ragflow-Rh****** INFO config ragflowDatasetId=b2****** INFO config sourceOssKeyId=******, sourceOssRegion=cn-beijing INFO Memverifikasi koneksi RAGFlow... INFO Mencoba mencantumkan dataset untuk memvalidasi koneksi... INFO Berhasil menemukan dataset yang cocok: Nama='test', ID='b2******' INFO Koneksi RAGFlow diverifikasi dengan sukses.
Lampiran
Dapatkan titik akhir API basis pengetahuan RAGFlow
Di panel navigasi sebelah kiri, klik API.
Salin nilai API Server.
Dapatkan kunci API basis pengetahuan RAGFlow
Di panel navigasi sebelah kiri, klik API.
Di sebelah kanan RAGFlow API, klik API KEY.
Di kotak dialog API KEY, klik Create New Key.
Klik
untuk mencatat token.
Dapatkan ID basis pengetahuan RAGFlow
Di halaman Knowledge Base, klik basis pengetahuan target.
Di URL halaman saat ini, catat ID basis pengetahuan.
CatatanInformasi setelah
id=adalah ID basis pengetahuan.