通過建立SelectDB資料來源能夠實現Dataphin讀取SelectDB的業務資料或向SelectDB寫入資料。本文為您介紹如何建立SelectDB資料來源。
背景資訊
SelectDB是廣泛應用於即時報表分析、即席多維分析、日誌檢索分析、資料聯邦與查詢加速等情境的資料倉儲,致力於為使用者提供極致效能、簡單易用的資料分析服務。
許可權說明
僅支援擁有建立資料來源許可權點的自訂全域角色和超級管理員、資料來源管理員、板塊架構師、專案系統管理員系統角色建立資料來源。
操作步驟
在Dataphin首頁,單擊頂部功能表列管理中心 > 資料來源管理。
在資料來源頁面,單擊+建立資料來源。
在建立資料來源頁面的巨量資料儲存地區,選擇SelectDB。
如果您最近使用過SelectDB,也可以在最近使用地區選取項目SelectDB。同時,您也可以在搜尋方塊中,輸入SelectDB的關鍵詞,快速搜尋。
在建立SelectDB資料來源頁面中,配置串連資料來源參數。
配置資料來源的基本資料
參數
描述
資料來源名稱
命名規則如下:
只能包含中文、英文字母大小寫、數字、底線(_)或短劃線(-)。
長度不能超過64字元。
資料來源編碼
配置資料來源編碼後,可在Flink_SQL任務中通過
資料來源編碼.table或資料來源編碼.schema.table的格式引用資料來源中的表;如果需要根據所處環境自動訪問對應環境的資料來源,請通過${資料來源編碼}.table或${資料來源編碼}.schema.table的格式訪問。更多資訊,請參見Flink_SQL任務開發方式。重要資料來源編碼配置成功後不支援修改。
資料來源編碼配置成功後,才能在資產目錄和資產清單的對象詳情頁面進行資料預覽。
Flink SQL中,目前僅支援MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB、GaussDB(DWS)資料來源。
核心版本
可選擇Cloud Core v3.0.x(基於Apache Doris v2.0.x)或Cloud Core v4.0.x(基於Apache Doris v3.0.x)。
資料來源描述
填寫資料來源簡單的描述。不得超過128個字元。
資料來源配置
選擇需要配置的資料來源:
如果業務資料來源區分生產資料來源和開發資料來源,則選擇生產+開發資料來源。
如果業務資料來源不區分生產資料來源和開發資料來源,則選擇生產資料來源
標籤
您可根據標籤給資料來源進行分類打標,如何建立標籤,請參見管理資料來源標籤。
配置資料來源與Datahpin的串連參數。
若您的資料來源配置選擇生產+開發資料來源,則需配置生產+開發資料來源的串連資訊。如果您的資料來源配置為生產資料來源,僅需配置生產資料來源的串連資訊。
說明通常情況下,生產資料來源和開發資料來源需配置為非同一個資料來源,以實現開發資料來源與生產資料來源的環境隔離,降低開發資料來源對生產資料來源的影響。但Dataphin也支援配置成同一個資料來源,即相同參數值。
參數
描述
JDBC URL
填寫SelectDB的JDBC URL串連地址。格式為:
jdbc:mysql://host:port/dbname。使用者名稱、密碼
登入資料庫的使用者名稱和密碼。
FE節點URL
FE(Front End)的Host和HTTP連接埠,格式為
fe_host:http_port,fe_host:http_port。如果有多個FE節點,使用英文逗號(,)分隔。SelectDB的預設HTTP連接埠為8030。配置資料來源的進階設定。
參數
描述
connectTimeout
資料庫的connectTimeout時間長度(單位:毫秒),預設900000毫秒(15分鐘)。
說明若您在JDBC URL中帶有connectTimeout配置,則connectTimeout為JDBC URL中配置的逾時時間。
Dataphin V3.11版本之前的建立資料來源,connectTimeout預設為
-1,表示無逾時限制。
socketTimeout
資料庫的socketTimeout時間長度(單位:毫秒),預設1800000毫秒(30分鐘)。
說明若您在JDBC URL中帶有socketTimeout配置,則socketTimeout為JDBC URL中配置的逾時時間。
Dataphin V3.11版本之前的建立資料來源,socketTimeout預設為
-1,表示無逾時限制。
串連重試次數
資料庫連接逾時,將自動重試串連直到完成設定的重試次數。若達最大重試次數仍未串連成功,則串連失敗。
說明預設重試次數為1次,支援配置0~10之間參數。
串連重試次數將預設應用於離線整合任務與全域品質(需開通資產品質功能模組),離線整合任務中支援單獨配置任務層級的重試次數。
選擇預設資源群組,該資源群組用於運行與當前資料來源相關任務,包括資料庫SQL、離線整庫遷移、資料預覽等。
進行測試連接或直接單擊確定進行儲存,完成SelectDB資料來源的建立。
單擊測試連接,系統將測試資料來源是否可以和Dataphin進行正常的連通。若直接單擊確定,系統將自動對所有已選中的叢集進行測試連接,但即使所選中的叢集均串連失敗,資料來源依然可以正常建立。