全部產品
Search
文件中心

Simple Log Service:使用SLS在日誌寫入時脫敏LLM應用的敏感性資料

更新時間:Mar 14, 2026

本方案介紹如何利用阿里雲Log Service的資料加工能力,在日誌資料持久化之前自動進行脫敏處理。通過此方案,可以有效保護LLM應用互動日誌中的敏感資訊,確保資料在後續營運、分析和審計環節的安全,滿足資料安全與合規要求。

業務情境說明

在基於LLM構建的智能客服、訂單處理等應用中,系統與使用者的互動日誌會記錄大量敏感性資料,例如手機號、收貨地址、銀行卡號、內部介面憑證等。若將這些原始日誌直接儲存,會在後續的查詢、共用或分析環節引發資料泄露風險,不符合《個人資訊保護法》等法規對“資料最小化”的處理原則。本方案旨在完整保留日誌結構和分析價值的前提下,實現敏感欄位的自動化、即時脫敏,確保所有人員訪問的都是脫敏後的安全資料,從源頭構建資料安全防線。

方案架構

本文將以一個電商 Copilot Demo 為例,展示如何藉助阿里雲Log Service的脫敏函數,在不改變商務邏輯的前提下,確保系統中的敏感性資料隱私安全。通過在應用伺服器上部署LoongCollector,將日誌統一發送至阿里雲Log Service。在日誌資料寫入LogStore之前,利用SLS的資料加工功能執行預設的SPL脫敏指令碼,對指定欄位進行脫敏。處理完成後的安全日誌最終被持久化儲存,供後續分析使用。

image
  • Dify 平台:作為 Copilot 的中樞,負責使用者意圖識別、服務調用編排與 LLM 回複產生。

  • 商務服務層:提供退款、訂單、物流等核心 API。

  • 日誌鏈路:通過 LoongCollector 統一採集各服務日誌,並推送至 SLS。

  • SLS 脫敏處理:在日誌寫入 LogStore 前,自動對敏感欄位執行脫敏。

  • 使用層:脫敏後的日誌可供營運、營運、安全團隊安全使用。

準備工作

在採集日誌前,需規劃並建立用於管理與儲存日誌的Project和LogStore。若已有可用資源,可跳過此步驟,直接進入步驟一:配置機器組(安裝LoongCollector)

建立Project

  1. 登入Log Service控制台

  2. 單擊建立Project,並配置:

    • 所屬地區:根據日誌來源選擇,建立後不可修改。

    • Project名稱:阿里雲內全域唯一,建立後不可修改。

    • 其他配置保持預設,單擊建立。如需瞭解其他參數,請參見建立Project

建立LogStore

  1. 單擊Project名稱,進入目標Project。

  2. 在左側導覽列,選擇image日誌儲存,單擊+

  3. 在建立LogStore頁面,完成以下核心配置:

    • LogStore名稱:設定一個在Project內唯一的名稱,該名稱建立後不可修改。

    • LogStore類型:根據規格對比選擇標準型或查詢型。

    • 計費模式

      • 按使用功能計費:按儲存、索引、讀寫次數等各項資源獨立計費。適合小規模或功能使用不確定的情境。

      • 按寫入資料量計費:僅按原始寫入資料量計費,提供30天免費儲存,以及免費的資料加工、投遞等功能。適合儲存周期接近30天或資料處理鏈路複雜的業務情境。

    • 資料儲存時間:設定日誌的保留天數(1~3650天,3650為永久儲存),預設為30天。

    • 其他配置保持預設,單擊確定。如需瞭解其他配置資訊,請參考管理LogStore

實施步驟

以下步驟將引導您完成從日誌採集到配置脫敏規則的全過程。

步驟一:配置機器組(安裝LoongCollector)

在完成準備工作後,為不同類型的伺服器安裝LoongCollector並將其加入機器組。

說明

以下安裝步驟僅適用於日誌源為阿里雲ECS執行個體,且該執行個體與Log ServiceProject屬於同一阿里雲帳號和相同地區的情境。

如果您的ECS執行個體與Project不在同一帳號或地區,或者日誌源為自建伺服器,請參考LoongCollector 安裝與配置進行操作。

配置步驟:

  1. image日誌庫頁面,單擊目標LogStore名稱前的image展開。

  2. 單擊資料接入後的image,在快速資料接入彈框中,選擇單行-文本日誌,單擊立即接入

  3. 機器組配置頁面,配置如下參數:

    • 使用情境主機情境

    • 安裝環境ECS

    • 配置機器組:根據目標伺服器的LoongCollector安裝情況與機器組配置狀態,選擇對應操作:

      • 已安裝LoongCollector且已加入某個機器組,直接在源機器組列表中勾選,將其添加至應用機器組列表,無需重複建立。

      • 未安裝LoongCollector,單擊建立機器組

        以下步驟將引導您完成LoongCollector的一鍵自動安裝並建立機器組。
        1. 系統會自動列出與 Project 同地區的 ECS 執行個體,勾選需要採集日誌的一台或多台執行個體。

        2. 單擊安裝並建立為機器組,系統將自動在所選ECS執行個體上安裝LoongCollector。

        3. 配置機器組名稱並單擊確定

        說明

        如果安裝失敗或一直處於等待中,請檢查ECS地區是否與Project相同。

  4. 檢查心跳狀態:單擊下一步,頁面出現機器組心跳情況。查看心跳狀態,若為OK表示機器組串連正常,單擊下一步,進入Logtail配置頁面。

    若為FAIL,可能是初次建立心跳需要花費一些時間,請等待兩分鐘左右,再重新整理心跳狀態。若重新整理後仍為FAIL,請參考心跳異常問題匯總排查

步驟二:配置日誌採集

完成LoongCollector安裝和機器組配置後,進入Logtail配置頁面,定義日誌採集和處理規則。

全域配置

  • 配置名稱:自訂採集配置名稱,例如llm-app-log-collection

輸入配置

  • 類型文本日誌採集

  • 檔案路徑:指定應用記錄檔的儲存路徑和檔案名稱。例如,/logs/app/*.log表示採集/logs/app/目錄下所有以.log結尾的檔案。

  • 最大目錄監控深度檔案路徑中萬用字元**匹配的最大目錄深度。預設為0,表示只監控本層目錄。

完成全域配置與輸入配置後,單擊下一步,進入查詢分析配置頁面:

  • 系統預設開啟全文索引,支援對日誌原始內容進行關鍵詞搜尋。

  • 如需按欄位進行精確查詢,請在頁面載入出預覽資料後,單擊自動產生索引,Log Service將根據預覽資料中的第一條內容產生欄位索引

配置完成後,單擊下一步,完成整個採集流程的設定。

步驟三:配置寫入側脫敏規則

針對本文電商Copilot日誌,在對應的Project中建立資料處理器,即可智能識別並對IP地址、郵箱等敏感內容進行脫敏。其中手機號、社會安全號碼、信用卡號、姓名以及地址資訊,定製化地保留前尾碼。

SLS提供的mask(脫敏)函數,支援內建和關鍵字匹配兩種模式,能高效、精準地識別並脫敏日誌中的敏感資訊:

  • 內建匹配(buildin):mask函數開箱即用,內建了對常見6種敏感資訊(如手機號、身份證、郵箱、IP地址、有線電話電話、銀行卡號)的識別能力。

  • 關鍵字匹配(keyword):智能識別任意文本中符合"key":"value"、'key':'value'或key=value 等常見 KV 對格式的敏感資訊。

  1. 在左側導覽列,選擇image資源 > 資料處理器

  2. 寫入處理器頁簽下,單擊建立,進行如下配置:

    • 處理器名稱:自訂處理器名稱,例如脫敏處理。

    • 處理失敗:保留未經處理資料。

    • SPL

      * | extend content = mask (content,' [
      {"mode":"buildin","types":["IP_ADDRESS","EMAIL", "LANDLINE_PHONE"]},
      {"mode":"buildin","types":["PHONE","IDCARD","CREDIT_CARD"],"maskChar":"*","keepPrefix":3,"keepSuffix":4},
      {"mode":"keyword","keys":["address"],"maskChar":"*","keepPrefix":3,"keepSuffix" :1},
      {"mode":"keyword","keys":["name"],"maskChar":"*","keepPrefix":1}]')
  3. 調試SPL脫敏指令碼,指令碼無誤後,單擊儲存

步驟四:關聯寫入處理器並查看日誌

  1. 在左側導覽列,選擇image日誌儲存,單擊目標LogStore名稱前的image展開。

  2. 單擊image,在LogStore屬性頁面,單擊寫入處理器

  3. 單擊修改,選擇建立的寫入處理器,並儲存

  4. 單擊右上方的查詢分析,查看處理後的日誌。脫敏前後日誌對比:

    image

    image

對比脫敏前的資料可以看到:

  • 按需保留,安全與可用性兼顧: 針對不同敏感欄位,可定製化保留前尾碼字元。手機號保留前三後四位,既保護了使用者隱私,又方便營運人員進行問題排查和使用者身份核驗,在保障安全的同時兼顧了資料可用性。

  • 配置極簡,無需正則:關鍵字匹配模式下,即使資料嵌套多層 JSON 結構,也只需配置最內層的 Key 即可精準匹配 Value 進行脫敏,同時無需編寫複雜的Regex來相容各種 key:value 對格式,大大降低了配置難度。中文精準脫敏:  姓名與地址精確按照配置的規則進行打碼,避免因編碼問題導致脫敏失效。

此外,mask函數相較於使用Regex進行脫敏,在效能上具有顯著優勢,可有效降低Tlog延遲,提升整體效能。尤其是在複雜或者資料量巨大的情境下,效能優勢更為明顯。

日誌分析

資料脫敏讓同一份日誌呈現出三種“視角”:

  • 營運:看到調用鏈與效能瓶頸,卻看不到隱私;

  • 營運:看到趨勢、效率與體驗,卻看不到個體;

  • 安全:看到策略執行與留痕證據,卻無需擔心遺漏。

在這套體系中,資料不再是一座孤島,而是一套有邊界的智能資產,資料合規、分析、排障三者可以並行。

營運工程師:定位

對於營運團隊來說,以往排障往往依賴包含使用者手機號、地址、賬戶號的明文日誌,這在合規上存在高風險。 現在,脫敏後的日誌讓這一過程從源頭安全化,在問題定位情境中通過trace_id 檢索即可複原整個調用鏈:

  • 從 Copilot 的意圖識別開始;

  • 到訂單服務 → 退款服務 → 第三方支付網關;

  • 再到返回結果與耗時。

需要核對使用者身份時,日誌裡只保留了脫敏後的銀行卡號、手機號等資訊,足以和業務側“同一使用者”比對,而不會暴露原值。即便是跨團隊協查,也能直接在脫敏日誌上定位問題,避免泄露風險。

營運團隊:分析

報表的價值在於發現整體趨勢,而非窺探個人資訊。在脫敏營運報表中,使用者資訊已匿名化處理,僅保留關鍵業務指標,助力團隊從資料中挖掘洞察。

從報表中,營運團隊可以快速瞭解:

  • 整體概況: UV、PV 等關鍵計量,Copilot 互動次數,以及諮詢總量,快速掌握營運概況。

  • 諮詢分類:退款、商品、物流諮詢佔比,清晰瞭解使用者關注點。

  • 問題分類:掌握使用者提問的側重點,如功能、價格、規格等。

  • 重複諮詢率:衡量服務品質,快速定位需要最佳化的環節。

  • 使用者行為:諮詢後購買轉化漏鬥,以及熱門諮詢關鍵詞,助力最佳化產品和營銷策略。

  • 重點使用者: Top 10 諮詢使用者,雖然使用者資訊脫敏,但可通過 VIP 等級和諮詢次數,制定差異化服務策略。

此外,報表中所有使用者資訊都經過脫敏處理,電話號碼、姓名等個人資訊均被掩碼,確保無法反推到具體使用者,充分保障使用者隱私。

安全與合規團隊:審計

對安全與合規團隊而言,日誌的最大風險在於“存量明文”。 本文中的脫敏方案將脫敏前置:資料在寫入前已被處理,這從根本上消除了敏感性資料脫敏覆蓋不全與匯出明文資料的可能。此外,SLS還提供完善的合規支撐能力:

  • 資料存放區:支援自訂日誌儲存時間,對網路審計相關日誌設定>180天的儲存天數,滿足安全審計要求。

  • 資料Action Trail:日誌使用過程中會存在使用者級操作行為,這些不管是管控層面的控制台操作、OpenAPI 呼叫,或者資料面的業務日誌使用,任何人查看、分析、匯出日誌,都只在授權範圍內看到應當看到的內容。同時CloudLens for SLS還提供Project、LogStore的資產使用監控。

總結

當LoongCollector的日誌採集與 LogStore 的資料脫敏連成閉環,日誌在落庫同時完成安全轉化。營運能定位,營運能分析,安全能審計。 這不僅是一次性的加固,而是一條可複用的路徑:寫入側脫敏 + 預設脫敏落庫 + 角色化訪問。 以此為基準,企業能放心擴充 Copilot 的業務覆蓋,讓“效率紅利”與“合規確定性”並行存在。