歸檔直讀是指直接存取OSS-HDFS服務中Archive Storage類型的檔案,而無需先對其解凍。歸檔直讀適用於即時讀取極少需要訪問的資料情境。
前提條件
已建立ECS執行個體。具體步驟,請參見選購ECS執行個體。
已開通OSS-HDFS服務。具體步驟,請參見開通OSS-HDFS服務。
阿里雲帳號預設擁有為Bucket開啟歸檔直讀功能的許可權。如果您希望通過RAM使用者的方式為Bucket開啟歸檔直讀功能,RAM使用者需要具備對應的許可權要求,詳情請參見授權RAM使用者通過非EMR叢集接入OSS-HDFS服務。
使用限制
歸檔直讀僅適用於OSS-HDFS服務Bucket中Archive Storage類型的檔案,不適用於其他儲存類型的檔案。
費用說明
為Bucket開啟歸檔直讀後,直接讀取Bucket中未解凍的Archive Storage類型檔案,會產生歸檔直讀資料取回容量(RetrievalDataArchiveDirect)費用,請求產生的歸檔直讀取回容量通過日誌欄位
archive_direct_read_size的值來表示。對於已解凍的Archive Storage類型檔案,直接讀取不會產生歸檔直讀資料取回容量費用。詳情請參見資料處理費用。歸檔直讀資料取回量取決於與HTTP建立串連時要求標頭中指定的資料讀取範圍。傳輸串連的提前斷開不會影響已發起請求的歸檔直讀資料取回容量。例如,實際讀取1位元組資料後中斷串連,但是請求範圍為100 MB~200 MB,將按照100 MB~200 MB計算歸檔直讀資料取回容量。
操作步驟
串連ECS執行個體。具體操作,請參見串連ECS執行個體。
下載Jindofs SDK。
配置存取金鑰和環境變數。
進入已安裝的Jindofs JAR包下的bin目錄。
以下以
jindofs-sdk-x.x.x-linux為例,如使用其他版本的JindoSDK,請替換為對應的JAR包名稱。cd jindofs-sdk-x.x.x-linux/bin/在bin目錄下建立設定檔jindofs.cfg,並配置阿里雲帳號的存取金鑰(包括Accesskey ID和Accesskey Secret),或者滿足許可權要求的RAM使用者的存取金鑰。
[client] fs.oss.accessKeyId = <key> fs.oss.accessKeySecret = <secret>設定環境變數。
說明<JINDOSDK_CONF_DIR>填寫
jindofs.cfg設定檔所在的絕對路徑。export JINDOSDK_CONF_DIR=<JINDOSDK_CONF_DIR>
為Bucket開啟歸檔直讀功能。
以下樣本用於為華東(上海)地區的examplebucket開啟歸檔直讀功能。其他地區的Bucket,請對應替換Region和Bucket名稱。
./jindofs admin -putConfig -dlsUri oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/ -conf namespace.archive.directread.enable=true查看Bucket歸檔直讀配置資訊。
./jindofs admin -getConfig -dlsUri oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/ -name namespace.archive.directread.enable返回資訊如下,說明Bucket已開啟歸檔直讀功能。
namespace.archive.directread.enable: true
後續步驟
為Bucket開啟歸檔直讀後,您無需解凍Bucket中的Archive Storage類型檔案,就可以直接對其進行涉及讀取的操作,包括下載檔案、查看檔案資訊、拷貝檔案的操作。
相關文檔
如果您未開啟歸檔直讀,需要先解凍,才能讀取Archive Storage類型檔案。如何解凍歸檔檔案,請參見臨時解凍歸檔檔案。