本文為您介紹品質規則的參數配置資訊。
資料表參數配置
資料表規則配置
模板類型 | 描述 |
完整性/唯一性 | 完整性-欄位空值校正/欄位Null 字元串校正 唯一性-欄位唯一性校正/欄位分組個數校正/欄位重複值個數校正:
|
及時性 |
|
有效性 |
|
一致性 |
|
穩定性 | |
自訂SQL |
說明 當規則模板選擇自訂SQL的自訂規則模板時,規則配置地區將自動解析該規則模板的變數欄位作為屬性值,您可以根據所屬規則模板的模板變數說明進行配置。 |
資料表校正配置說明
模板類型 | 配置項 | 描述 |
完整性 | 異常行數/正常行數/異常率/正常率 |
|
唯一性 | 異常行數/正常行數/異常率/正常率 |
|
統計值 | 指去重值定義, | |
統計值(重複行數/重複率) |
| |
及時性、有效性 | 異常行數/正常行數/異常率/正常率 |
|
一致性 | 統計差值、統計差異率(%) | 統計差值:校正欄位-對比欄位。 統計差異率:校正欄位/對比欄位。 |
穩定性 | 統計值(1天波動率、7天波動率、30天波動率) | 與1天、7天、30天前採集的錶行數進行比較,對比波動率,再與設定的閾值進行比較,只要有一個不符合規則,則觸發警示。 |
自訂SQL | 異常行數/正常行數/異常率/正常率 |
|
統計值(1天波動率、7天波動率、30天波動率) | 與1天、7天、30天前採集的錶行數進行比較,對比波動率,再與設定的閾值進行比較,只要有一個不符合規則,則觸發警示。 |
指標參數配置
指標規則配置
模板類型 | 描述 |
唯一性 | 欄位分組個數校正/欄位重複值個數校正:需配置資料過濾。 資料過濾:預設關閉,開啟後可配置校正表的過濾條件或分區過濾或普通資料過濾,過濾條件將會直接追加至校正SQL中;如校正表有分區過濾需求,建議在調度配置中配置分區運算式,配置後會以校正分區為最小查看粒度查看品質報告。填寫資料過濾內容,例如:
|
穩定性 | 欄位穩定性校正/欄位波動性校正:
|
指標校正配置
模板類型 | 配置項 | 描述 |
唯一性 | 欄位分組個數 | 取該欄位的分組後的個數與設定的固定值進行比較。 |
統計值(重複行數/重複率) |
| |
穩定性 | 統計值 | 指去重後的值, |
統計值(1天波動率、7天波動率、30天波動率) | 與1天、7天、30天前採集的錶行數進行比較,對比波動率,再與設定的閾值進行比較,只要有一個不符合規則,則觸發警示。 | |
均值波動檢測(7天波動、30天波動) | 基準值是最近7天、30天的錶行數的平均值,對比最近7天、30天平均值的波動率。 | |
統計值(相比當月1號天波動率、相比上月波動率、相比上年波動率) | 與本月1號、上月、上年採集的錶行數進行比較,對比波動率,再與設定的閾值進行比較,只要有一個不符合規則,則觸發警示。 |
即時元表參數配置
離線鏈路對比參數配置
即時資料與離線資料在使用相同統計路邏輯時,即時離線資料核對品質規則可以檢測資料之間的差異。如果差異較大,可能存在資料品質的問題。
參數 | 描述 |
校正欄位 | 選擇需要校正的欄位。 |
指標運算元 | 選擇資料的演算法。 |
對象形式 | 選擇單值資料和多值資料。 |
時間限定條件 | 選擇時間限定的欄位。 |
開啟條件限定 | 選擇開啟或關閉條件限定。 |
離線資料 | 下拉選擇離線資料表。 |
離線取數 | 預設關閉,開啟後通過SQL語句配置離線資料表的取數。 |
時區設定 | 下拉選擇時區。 |
多鏈路對比參數配置
在業務有強保障情境中,可以通過即時雙鏈路或即時三鏈路品質規則監測資料。如果有異常,營運人員能夠及時切換或備份資料。即時多鏈路對比品質規則支援監控資料滯留、統計偏差等問題。
參數 | 描述 |
校正欄位 | 選擇需要校正的欄位。 |
指標運算元 | 選擇資料的演算法。 |
對象形式 | 選擇單值資料和多值資料。 |
時間限定條件 | 選擇時間限定的欄位。 |
開啟條件限定 | 選擇開啟或關閉條件限定。 |
對比鏈路數 | 選擇品質規則的對比鏈路數。系統支援選擇即時三鏈路對比和即時雙鏈路對比。 |
對比鏈路1/對比鏈路2 | 選擇即時元表作為對比鏈路資料:
|
時區設定 | 下拉選擇時區。 |
