本方案介紹如何利用阿里雲Log Service的資料加工能力,在日誌資料持久化之前自動進行脫敏處理。通過此方案,可以有效保護LLM應用互動日誌中的敏感資訊,確保資料在後續營運、分析和審計環節的安全,滿足資料安全與合規要求。
業務情境說明
在基於LLM構建的智能客服、訂單處理等應用中,系統與使用者的互動日誌會記錄大量敏感性資料,例如手機號、收貨地址、銀行卡號、內部介面憑證等。若將這些原始日誌直接儲存,會在後續的查詢、共用或分析環節引發資料泄露風險,不符合《個人資訊保護法》等法規對“資料最小化”的處理原則。本方案旨在完整保留日誌結構和分析價值的前提下,實現敏感欄位的自動化、即時脫敏,確保所有人員訪問的都是脫敏後的安全資料,從源頭構建資料安全防線。
方案架構
本文將以一個電商 Copilot Demo 為例,展示如何藉助阿里雲Log Service的脫敏函數,在不改變商務邏輯的前提下,確保系統中的敏感性資料隱私安全。通過在應用伺服器上部署LoongCollector,將日誌統一發送至阿里雲Log Service。在日誌資料寫入LogStore之前,利用SLS的資料加工功能執行預設的SPL脫敏指令碼,對指定欄位進行脫敏。處理完成後的安全日誌最終被持久化儲存,供後續分析使用。
-
Dify 平台:作為 Copilot 的中樞,負責使用者意圖識別、服務調用編排與 LLM 回複產生。
-
商務服務層:提供退款、訂單、物流等核心 API。
-
日誌鏈路:通過 LoongCollector 統一採集各服務日誌,並推送至 SLS。
-
SLS 脫敏處理:在日誌寫入 LogStore 前,自動對敏感欄位執行脫敏。
-
使用層:脫敏後的日誌可供營運、營運、安全團隊安全使用。
準備工作
在採集日誌前,需規劃並建立用於管理與儲存日誌的Project和LogStore。若已有可用資源,可跳過此步驟,直接進入步驟一:配置機器組(安裝LoongCollector)。
實施步驟
以下步驟將引導您完成從日誌採集到配置脫敏規則的全過程。
步驟一:配置機器組(安裝LoongCollector)
在完成準備工作後,為不同類型的伺服器安裝LoongCollector並將其加入機器組。
以下安裝步驟僅適用於日誌源為阿里雲ECS執行個體,且該執行個體與Log ServiceProject屬於同一阿里雲帳號和相同地區的情境。
如果您的ECS執行個體與Project不在同一帳號或地區,或者日誌源為自建伺服器,請參考LoongCollector 安裝與配置進行操作。
配置步驟:
-
在
日誌庫頁面,單擊目標LogStore名稱前的
展開。 -
單擊資料接入後的
,在快速資料接入彈框中,選擇單行-文本日誌,單擊立即接入。 -
在機器組配置頁面,配置如下參數:
-
使用情境:主機情境
-
安裝環境:ECS
-
配置機器組:根據目標伺服器的LoongCollector安裝情況與機器組配置狀態,選擇對應操作:
-
已安裝LoongCollector且已加入某個機器組,直接在源機器組列表中勾選,將其添加至應用機器組列表,無需重複建立。
-
未安裝LoongCollector,單擊建立機器組:
以下步驟將引導您完成LoongCollector的一鍵自動安裝並建立機器組。
-
系統會自動列出與 Project 同地區的 ECS 執行個體,勾選需要採集日誌的一台或多台執行個體。
-
單擊安裝並建立為機器組,系統將自動在所選ECS執行個體上安裝LoongCollector。
-
配置機器組名稱並單擊確定。
說明如果安裝失敗或一直處於等待中,請檢查ECS地區是否與Project相同。
-
-
-
-
檢查心跳狀態:單擊下一步,頁面出現機器組心跳情況。查看心跳狀態,若為OK表示機器組串連正常,單擊下一步,進入Logtail配置頁面。
若為FAIL,可能是初次建立心跳需要花費一些時間,請等待兩分鐘左右,再重新整理心跳狀態。若重新整理後仍為FAIL,請參考心跳異常問題匯總排查。
步驟二:配置日誌採集
完成LoongCollector安裝和機器組配置後,進入Logtail配置頁面,定義日誌採集和處理規則。
全域配置:
-
配置名稱:自訂採集配置名稱,例如
llm-app-log-collection。
輸入配置:
-
類型:文本日誌採集。
-
檔案路徑:指定應用記錄檔的儲存路徑和檔案名稱。例如,
/logs/app/*.log表示採集/logs/app/目錄下所有以.log結尾的檔案。 -
最大目錄監控深度:檔案路徑中萬用字元
**匹配的最大目錄深度。預設為0,表示只監控本層目錄。
完成全域配置與輸入配置後,單擊下一步,進入查詢分析配置頁面:
配置完成後,單擊下一步,完成整個採集流程的設定。
步驟三:配置寫入側脫敏規則
針對本文電商Copilot日誌,在對應的Project中建立資料處理器,即可智能識別並對IP地址、郵箱等敏感內容進行脫敏。其中手機號、社會安全號碼、信用卡號、姓名以及地址資訊,定製化地保留前尾碼。
SLS提供的mask(脫敏)函數,支援內建和關鍵字匹配兩種模式,能高效、精準地識別並脫敏日誌中的敏感資訊:
-
內建匹配(
buildin):mask函數開箱即用,內建了對常見6種敏感資訊(如手機號、身份證、郵箱、IP地址、有線電話電話、銀行卡號)的識別能力。 -
關鍵字匹配(
keyword):智能識別任意文本中符合"key":"value"、'key':'value'或key=value 等常見 KV 對格式的敏感資訊。
-
在左側導覽列,選擇
。 -
在寫入處理器頁簽下,單擊建立,進行如下配置:
-
處理器名稱:自訂處理器名稱,例如脫敏處理。
-
處理失敗:保留未經處理資料。
-
SPL:
* | extend content = mask (content,' [ {"mode":"buildin","types":["IP_ADDRESS","EMAIL", "LANDLINE_PHONE"]}, {"mode":"buildin","types":["PHONE","IDCARD","CREDIT_CARD"],"maskChar":"*","keepPrefix":3,"keepSuffix":4}, {"mode":"keyword","keys":["address"],"maskChar":"*","keepPrefix":3,"keepSuffix" :1}, {"mode":"keyword","keys":["name"],"maskChar":"*","keepPrefix":1}]')
-
-
調試SPL脫敏指令碼,指令碼無誤後,單擊儲存。
步驟四:關聯寫入處理器並查看日誌
-
在左側導覽列,選擇
,單擊目標LogStore名稱前的
展開。 -
單擊
,在LogStore屬性頁面,單擊寫入處理器。 -
單擊修改,選擇建立的寫入處理器,並儲存。
-
單擊右上方的查詢分析,查看處理後的日誌。脫敏前後日誌對比:


對比脫敏前的資料可以看到:
-
按需保留,安全與可用性兼顧: 針對不同敏感欄位,可定製化保留前尾碼字元。手機號保留前三後四位,既保護了使用者隱私,又方便營運人員進行問題排查和使用者身份核驗,在保障安全的同時兼顧了資料可用性。
-
配置極簡,無需正則:關鍵字匹配模式下,即使資料嵌套多層 JSON 結構,也只需配置最內層的 Key 即可精準匹配 Value 進行脫敏,同時無需編寫複雜的Regex來相容各種 key:value 對格式,大大降低了配置難度。中文精準脫敏: 姓名與地址精確按照配置的規則進行打碼,避免因編碼問題導致脫敏失效。
此外,mask函數相較於使用Regex進行脫敏,在效能上具有顯著優勢,可有效降低Tlog延遲,提升整體效能。尤其是在複雜或者資料量巨大的情境下,效能優勢更為明顯。
日誌分析
資料脫敏讓同一份日誌呈現出三種“視角”:
-
營運:看到調用鏈與效能瓶頸,卻看不到隱私;
-
營運:看到趨勢、效率與體驗,卻看不到個體;
-
安全:看到策略執行與留痕證據,卻無需擔心遺漏。
在這套體系中,資料不再是一座孤島,而是一套有邊界的智能資產,資料合規、分析、排障三者可以並行。
營運工程師:定位
對於營運團隊來說,以往排障往往依賴包含使用者手機號、地址、賬戶號的明文日誌,這在合規上存在高風險。 現在,脫敏後的日誌讓這一過程從源頭安全化,在問題定位情境中通過trace_id 檢索即可複原整個調用鏈:
-
從 Copilot 的意圖識別開始;
-
到訂單服務 → 退款服務 → 第三方支付網關;
-
再到返回結果與耗時。
需要核對使用者身份時,日誌裡只保留了脫敏後的銀行卡號、手機號等資訊,足以和業務側“同一使用者”比對,而不會暴露原值。即便是跨團隊協查,也能直接在脫敏日誌上定位問題,避免泄露風險。
營運團隊:分析
報表的價值在於發現整體趨勢,而非窺探個人資訊。在脫敏營運報表中,使用者資訊已匿名化處理,僅保留關鍵業務指標,助力團隊從資料中挖掘洞察。
從報表中,營運團隊可以快速瞭解:
-
整體概況: UV、PV 等關鍵計量,Copilot 互動次數,以及諮詢總量,快速掌握營運概況。
-
諮詢分類:退款、商品、物流諮詢佔比,清晰瞭解使用者關注點。
-
問題分類:掌握使用者提問的側重點,如功能、價格、規格等。
-
重複諮詢率:衡量服務品質,快速定位需要最佳化的環節。
-
使用者行為:諮詢後購買轉化漏鬥,以及熱門諮詢關鍵詞,助力最佳化產品和營銷策略。
-
重點使用者: Top 10 諮詢使用者,雖然使用者資訊脫敏,但可通過 VIP 等級和諮詢次數,制定差異化服務策略。
此外,報表中所有使用者資訊都經過脫敏處理,電話號碼、姓名等個人資訊均被掩碼,確保無法反推到具體使用者,充分保障使用者隱私。
安全與合規團隊:審計
對安全與合規團隊而言,日誌的最大風險在於“存量明文”。 本文中的脫敏方案將脫敏前置:資料在寫入前已被處理,這從根本上消除了敏感性資料脫敏覆蓋不全與匯出明文資料的可能。此外,SLS還提供完善的合規支撐能力:
-
資料存放區:支援自訂日誌儲存時間,對網路審計相關日誌設定>180天的儲存天數,滿足安全審計要求。
-
資料Action Trail:日誌使用過程中會存在使用者級操作行為,這些不管是管控層面的控制台操作、OpenAPI 呼叫,或者資料面的業務日誌使用,任何人查看、分析、匯出日誌,都只在授權範圍內看到應當看到的內容。同時CloudLens for SLS還提供Project、LogStore的資產使用監控。
總結
當LoongCollector的日誌採集與 LogStore 的資料脫敏連成閉環,日誌在落庫同時完成安全轉化。營運能定位,營運能分析,安全能審計。 這不僅是一次性的加固,而是一條可複用的路徑:寫入側脫敏 + 預設脫敏落庫 + 角色化訪問。 以此為基準,企業能放心擴充 Copilot 的業務覆蓋,讓“效率紅利”與“合規確定性”並行存在。