全部产品
Search
文档中心

Data Transmission Service:Tutorial: Menghubungkan Lark ke Basis Pengetahuan RAGFlow DTS

更新时间:Aug 14, 2025

Topik ini menjelaskan cara mentransfer data dari Lark ke Basis Pengetahuan RAGFlow Data Transmission Service (DTS).

Prasyarat

Anda telah membuat Basis Pengetahuan RAGFlow di DTS dan mengonfigurasi daftar putih IP.

Informasi latar belakang

Tipe data yang didukung

DTS RAGFlow mendukung koneksi ke Lark Docs, buku kerja, Bitable, dan basis pengetahuan di Lark.

Metode untuk mengakses Lark

Anda dapat mengakses data Lark menggunakan kredensial akses aplikasi (tenant_access_token) atau kredensial akses pengguna (user_access_token).

Metode

Tipe izin

Kelebihan

Kekurangan

tenant_access_token (Direkomendasikan)

Identitas aplikasi

  • Mendukung transfer yang dapat dilanjutkan.

  • Untuk transfer satu folder atau basis pengetahuan, Anda hanya perlu mengonfigurasinya sekali.

Membutuhkan lebih banyak langkah untuk otorisasi. Anda perlu mengonfigurasi izin akses tambahan untuk Cloud Drive dan basis pengetahuan.

user_access_token

Identitas pengguna

Membutuhkan lebih sedikit langkah untuk otorisasi. Ini memiliki izin akses ke semua folder, sehingga Anda tidak perlu mengonfigurasi izin akses tambahan untuk Cloud Drive dan basis pengetahuan.

  • Anda harus mendapatkan (atau mendapatkan ulang) kode otorisasi Lark setiap kali menjalankan program KBSync.

  • Kode otorisasi Lark kedaluwarsa. Anda harus mendapatkan yang baru setelah kadaluwarsa.

Persiapan

  1. Masuk ke Platform Terbuka Lark dan buka Developer Console.

  2. Buat aplikasi.

    Klik Create Custom App, konfigurasikan informasi seperti Name dan App Description, lalu klik Create.

  3. Klik kartu aplikasi untuk masuk ke halaman pengeditan aplikasi.

    Secara default, halaman Basic Information > Credentials & Basic Info muncul.

  4. Di halaman Credentials & Basic Info, di bagian App Credentials, catat App ID dan App Secret.

Prosedur

Catatan

Untuk informasi lebih lanjut tentang operasi Lark, lihat dokumentasi resmi Lark (Pusat Bantuan dan Dokumentasi Pengembang).

Langkah 1: Konfigurasikan izin akses

Gunakan tenant_access_token

  1. Masuk ke Platform Terbuka Lark dan buka Developer Console.

  2. Klik aplikasi yang Anda buat di bagian Persiapan.

  3. Tambahkan bot dan publikasikan aplikasi.

    1. Di panel navigasi di sebelah kiri, pilih App Features > Add App Features.

    2. Di tab Add By Feature, temukan kartu Bot dan klik Add.

    3. Di bagian atas halaman, klik Create Version.

      Catatan

      Sebagai alternatif, di panel navigasi di sebelah kiri, pilih App Release > Version Management & Release, lalu klik Create Version.

    4. Di halaman Version Details, masukkan App Version dan Update Notes.

      Catatan

      Biarkan nilai default Bot untuk Default Feature On Mobile dan Default Feature On Desktop.

    5. Klik Save.

    6. Di kotak dialog yang muncul, klik Confirm Release.

  4. Konfigurasikan izin API.

    1. Di panel navigasi di sebelah kiri, pilih Development Configuration > Permissions & Scopes.

    2. Klik Bulk Import/Export Scopes.

    3. Di tab Import, di kotak teks JSON, masukkan izin berikut untuk aplikasi.

      {
        "scopes": {
          "tenant": [
            "docs:document:export",
            "drive:drive",
            "wiki:wiki"
          ],
          "user": []
        }
      }
    4. Klik Next, Confirm New Scopes.

    5. Klik Request To Activate.

  5. Masuk ke klien Lark, buat grup baru, dan tambahkan aplikasi yang Anda buat di bagian Persiapan sebagai Group Bot.

  6. Konfigurasikan izin akses untuk Cloud Drive dan basis pengetahuan.

    Konfigurasikan izin akses Cloud Drive

    1. Buka folder target Cloud Drive.

    2. Di sisi kanan halaman, klik Share.

    3. Untuk Invite Collaborators, masukkan grup audiens yang Anda buat di Langkah 5.

      Izin default Can View sudah cukup.

    4. Klik Send.

    Konfigurasikan izin akses basis pengetahuan

    1. Buka halaman Semua Basis Pengetahuan.

    2. Arahkan mouse ke basis pengetahuan target, lalu klik ikon Knowledge Base Settings yang muncul.

    3. Klik tab Member Settings. Di bagian Roles & Permissions, pada tab Administrator, klik Add Administrator.

    4. Di kotak dialog yang muncul, tambahkan grup audiens yang Anda buat di Langkah 5, lalu klik Next.

    5. Klik Send.

Gunakan user_access_token

  1. Masuk ke Platform Terbuka Lark dan buka Developer Console.

  2. Klik aplikasi yang Anda buat di bagian Persiapan.

  3. Konfigurasikan izin API.

    1. Di panel navigasi di sebelah kiri, pilih Development Configuration > Permissions & Scopes.

    2. Klik Bulk Import/Export Scopes.

    3. Konfigurasikan izin identitas pengguna untuk aplikasi yang dibuat di bagian Persiapan.

      {
        "scopes": {
          "tenant": [],
          "user": [
            "offline_access",
            "docs:document:export",
            "drive:drive",
            "wiki:wiki"
          ]
        }
      }
    4. Klik Next, Confirm New Scopes.

    5. Klik Request To Activate.

  4. Anda dapat mengonfigurasi daftar putih IP pengalihan.

    1. Di panel navigasi di sebelah kiri, pilih Development Configuration > Security Settings.

    2. Di kotak teks Redirect URLs, masukkan https://www.aliyun.com.

    3. Klik Add di sebelah kanan kotak teks.

    4. Nyalakan sakelar Refresh User_access_token.

      Catatan

      Jika sakelar ini tidak tersedia, fitur tersebut diaktifkan secara default.

  5. Dapatkan kode otorisasi.

    1. Buat URL untuk halaman otorisasi Lark.

      Catatan

      Ganti YOUR_FEISHU_CLIENT_ID di URL berikut dengan App ID yang Anda catat di bagian Persiapan.

      https://accounts.feishu.cn/open-apis/authen/v1/authorize?client_id=YOUR_FEISHU_CLIENT_ID&redirect_uri=https://www.aliyun.com&scope=drive:drive offline_access docs:document:export wiki:wiki
    2. Buka halaman otorisasi di browser.

    3. Klik Authorize.

    4. Ambil kode otorisasi (code) dari URL pengalihan.

      Catatan

      Kode otorisasi tidak termasuk simbol code=, &, atau informasi apa pun yang mengikuti simbol &.

Langkah 2: Dapatkan token folder Lark Doc dan ID basis pengetahuan

  1. Masuk ke klien Lark.

  2. Dapatkan token folder Lark Doc.

    1. Buka folder target.

    2. Salin URL folder dari bilah alamat.

    3. Ekstrak token dari URL. Token adalah string karakter setelah folder/.

      Catatan

      Token tidak mencakup simbol ? atau informasi yang mengikutinya.

  3. Dapatkan ID basis pengetahuan.

    1. Buka halaman Semua Basis Pengetahuan.

    2. Arahkan mouse ke basis pengetahuan target, lalu klik ikon Knowledge Base Settings yang muncul.

    3. Salin URL basis pengetahuan target dari bilah alamat.

    4. Ekstrak ID basis pengetahuan dari URL. ID adalah string karakter setelah settings/.

      Catatan

      ID basis pengetahuan hanya berisi angka dan tidak termasuk simbol # atau informasi yang mengikuti.

Langkah 3: Jalankan program KBSync

  1. Dapatkan file KBSync.

    Catatan

    Anda dapat bergabung dengan grup DingTalk (ID: 79690034672) dan hubungi helpdesk untuk mendapatkan file KBSync.

  2. Siapkan lingkungan runtime untuk program KBSync.

    Catatan

    Program KBSync harus berjalan di lingkungan Linux yang dapat mengakses Platform Terbuka Lark dan RAGFlow.

  3. Siapkan file konfigurasi config.

    1. Buat file Linux bernama config.

    2. Salin kode berikut ke file config.

      whiteList=
      blackList=
      sinkType=RagFlow
      sourceType=FeiShu
      ragflowUrl=http://XX.XX.XX.XX
      ragflowApiKey=Bearer RAGFlow-BmND******MDI0Mm
      ragflowDatasetId=928d061******2ac120006
      feishuAppId=cli_a8a******d00d
      feishuAppSecret=pMp73Si******UDrWXBSOa
      feishuUserAccessCode=bGzpx6******B9KFCdzdCDHG
      feishuCloudSpaceDirToken=ESJm*******CRdn002cii3bnAc
      feishuWikiSpaceId=7504968******8674
    3. Ganti parameter di file config.

      Penting
      • Untuk parameter yang tidak perlu dikonfigurasi, biarkan nilainya kosong.

      • Jika Anda melewati parameter untuk feishuCloudSpaceDirToken dan feishuWikiSpaceId, hanya Lark Docs dan folder induknya yang ditransfer (hanya parameter feishuCloudSpaceDirToken yang berlaku).

      • Parameter blackList memiliki prioritas lebih tinggi daripada parameter whiteList.

      Parameter

      Wajib

      Deskripsi

      Cara mendapatkan

      whiteList

      Tidak

      Path untuk ditransfer (whitelist) dan tidak ditransfer (blacklist). Ini mencakup path folder di Lark Docs dan path dokumen di basis pengetahuan.

      Catatan

      Ekspresi reguler didukung. Pisahkan beberapa path dengan spasi.

      Dapatkan ini dari klien Lark.

      blackList

      Tidak

      sinkType

      Ya

      Tipe sink.

      Biarkan nilainya sebagai RagFlow.

      sourceType

      Ya

      Tipe sumber.

      Biarkannilainya sebagai Feishu.

      ragflowUrl

      Ya

      Alamat RAGFlow (API Server).

      Dapatkan endpoint API Basis Pengetahuan RAGFlow.

      ragflowApiKey

      Ya

      Kunci API Basis Pengetahuan RAGFlow.

      Dapatkan kunci API Basis Pengetahuan RAGFlow.

      ragflowDatasetId

      Ya

      ID Basis Pengetahuan RAGFlow.

      Dapatkan ID Basis Pengetahuan RAGFlow.

      feishuAppId

      Ya

      ID aplikasi di Lark (App ID).

      Dapatkan App ID dan App Secret.

      feishuAppSecret

      Ya

      Rahasia aplikasi di Lark (App Secret).

      feishuUserAccessCode

      Tidak

      Catatan

      Parameter ini hanya diperlukan jika Anda menggunakan metode user_access_token untuk mengakses data Lark.

      Kode otorisasi Lark.

      Dapatkan kode otorisasi.

      feishuCloudSpaceDirToken

      Tidak

      Catatan

      Anda hanya perlu melewati parameter untuk salah satu dari ini.

      Token folder yang berisi Lark Docs.

      Dapatkan token folder Lark Doc dan ID basis pengetahuan.

      feishuWikiSpaceId

      ID basis pengetahuan Lark.

  4. Letakkan file KBSync dan file konfigurasi config di folder yang sama di lingkungan Linux.

  5. Di lingkungan Linux, jalankan perintah ./KBSync --config config untuk memulai program KBSync.

    Jika outputnya mirip dengan berikut, program KBSync sedang berjalan dengan benar.

    ./KBSync --config config
    
    INFO config whiteList=, blackList=
    INFO config ragflowUrl=http://XX.XX.XX.XX/, ragflowApiKey=Bearer RAGFlow-BmND******MDI0Mm
    INFO config ragflowDatasetId=928d061******2ac120006
    INFO config feishuAppId=cli_a8a******d00d, feishuAppSecret=pMp73Si******UDrWXBSOa
    INFO Response from https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal: 200, headers: {'Server': 'Tengine', 'Content-Type': 'application/json', 'Content-Length': '102', 'Connection': 'keep-alive', 'Date': 'Tue, 08 Jul 2025 02:49:01 GMT', 'Request-Id': '25bf****-d386-4a86-****-f440f070****', 'Tt_st****': '1', 'X-Lgw-Dst-Svc': 'jbpiSR****OiA0J3d****-Oz0xugYAH9otZIFg4x****', 'X-Request-Id': '25bf****-d386-4a86-b9f4-f440f070****', 'X-Tt-Logid': '202507081049012933B870245850D****', 'server-timing': 'inner; dur=73, cdn-cache;desc=MISS,edge;dur=0,origin;dur=129', 'x-tt-trace-host': '****', 'x-tt-trace-tag': '****', 'x-tt-trace-id': '00-****', 'X-Timestamp': '175194****.952', 'Via': 'cache8.cn6540[129,0]', 'Timing-Allow-Origin': '*', 'EagleId': '6ae3651c1751942941849****'}, body: b'{"code":0,"expire":4340,"msg":"ok","tenant_access_token":"t-g10478a*******CSC3YVY"}'
    INFO set feishu tenant access token expires in: 4340

Lampiran

Dapatkan endpoint API Basis Pengetahuan RAGFlow

  1. Masuk ke halaman RAGFlow.

  2. Di panel navigasi di sebelah kiri, klik API.

  3. Salin nilai API Server.

Dapatkan kunci API Basis Pengetahuan RAGFlow

  1. Masuk ke halaman RAGFlow.

  2. Di panel navigasi di sebelah kiri, klik API.

  3. Di sebelah kanan RAGFlow API, klik API KEY.

  4. Di kotak dialog API KEY, klik Create New Key.

  5. Klik image untuk mencatat token.

Dapatkan ID Basis Pengetahuan RAGFlow

  1. Masuk ke halaman RAGFlow.

  2. Di halaman Knowledge Base, klik basis pengetahuan target.

  3. Di URL halaman saat ini, catat ID basis pengetahuan.

    Catatan

    Informasi setelah id= adalah ID basis pengetahuan.