通過建立OSS資料來源能夠實現Dataphin讀取OSS的業務資料或向OSS寫入資料。本文為您介紹如何建立OSS資料來源。
背景資訊
OSS即阿里雲Object Storage Service。阿里雲Object Storage Service(Object Storage Service)是一款海量、安全、低成本、高可靠的雲端儲存體服務。如果您使用的是阿里雲Object Storage Service,在對接Dataphin進行資料開發或將Dataphin的資料寫入至OSS時,您需要先完成OSS資料來源的建立。更多OSS資訊,請參見什麼是Object Storage Service。
許可權說明
僅支援擁有建立資料來源許可權點的自訂全域角色和超級管理員、資料來源管理員、板塊架構師、專案系統管理員系統角色建立資料來源。
操作步驟
在Dataphin首頁,單擊頂部功能表列管理中心 > 資料來源管理。
在資料來源頁面,單擊+建立資料來源。
在建立資料來源頁面的檔案地區,選擇OSS。
如果您最近使用過OSS,也可以在最近使用地區選取項目OSS。同時,您也可以在搜尋方塊中,輸入OSS的關鍵詞,快速搜尋。
在建立OSS資料來源頁面中,配置串連資料來源參數。
配置資料來源的基本資料。
參數
描述
資料來源名稱
命名規則如下:
只能包含中文、英文字母大小寫、數字、底線(_)或短劃線(-)。
長度不能超過64字元。
資料來源編碼
配置資料來源編碼後,您可以在Flink_SQL任務中通過
資料來源編碼.表名稱或資料來源編碼.schema.表名稱的格式引用資料來源中的表;如果需要根據所處環境自動訪問對應環境的資料來源,請通過${資料來源編碼}.table或${資料來源編碼}.schema.table的變數格式訪問。更多資訊,請參見Dataphin資料來源表開發方式。重要資料來源編碼配置成功後不支援修改。
資料來源編碼配置成功後,才能在資產目錄和資產清單的對象詳情頁面進行資料預覽。
Flink SQL中,目前僅支援MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB資料來源。
資料來源描述
對資料來源的簡單描述,不超過128個字元。
資料來源配置
選擇需要配置的資料來源:
如果業務資料來源區分生產資料來源和開發資料來源,則選擇生產+開發資料來源。
如果業務資料來源不區分生產資料來源和開發資料來源,則選擇生產資料來源。
標籤
您可根據標籤給資料來源進行分類打標,如何建立標籤,請參見管理資料來源標籤。
配置資料來源與Dataphin的串連參數。
若您的資料來源配置選擇生產+開發資料來源,則需配置生產+開發資料來源的串連資訊。如果您的資料來源配置為生產資料來源,僅需配置生產資料來源的串連資訊。
說明通常情況下,生產資料來源和開發資料來源需配置非同一個資料來源,以使開發資料來源與生產資料來源的環境隔離,降低開發資料來源對生產資料來源的影響。但Dataphin也支援配置成同一個資料來源,即相同參數值。
參數
描述
Endpoint
OSS所在地區對應的Endpoint,格式為
http://{oss-Region}.aliyuncs.com,其中Region為Bucket所在地區。例如,華東1(杭州)的Endpoint填寫為https://oss-cn-hangzhou.aliyuncs.comOSS服務的Endpoint和地區有關。訪問不同的地區時,需要填寫不同的網域名稱。
Bucket
OSS所在地區對應的Bucket資訊。用於儲存物件的容器。在Bucket 列表頁面,擷取OSS所在地區對應的Bucket。
您可以建立一個或多個儲存空間,每個儲存空間可添加一個或多個檔案。您可以在資料同步任務中尋找此處輸入的儲存空間中相應的檔案,沒有添加的儲存空間,則不能尋找其中的檔案。
目錄
如僅有特定目錄下的許可權,可在此指定目錄路徑。例如,
/dataphin/。CNAME
非必填,OSS資料來源的自訂網域名名稱。阿里雲OSS自訂網域名詳情請參見使用自有網域名稱訪問OSS資源。
Access ID、Access Key
OSS資料來源所在帳號的AccessKey ID和AccessKey Secret。
如何擷取,請參見擷取AccessKey。
選擇預設資源群組,該資源群組用於運行與當前資料來源相關任務,包括資料庫SQL、離線整庫遷移、資料預覽等。
進行測試連接或直接單擊確定進行儲存,完成OSS資料來源的建立。
單擊測試連接,系統將測試資料來源是否可以和Dataphin進行正常的連通。若直接單擊確定,系統將自動對所有已選中的叢集進行測試連接,但即使所選中的叢集均串連失敗,資料來源依然可以正常建立。