全部產品
Search
文件中心

Object Storage Service:無需解凍直接即時讀取OSS-HDFS服務歸檔檔案

更新時間:Sep 17, 2025

歸檔直讀是指直接存取OSS-HDFS服務中Archive Storage類型的檔案,而無需先對其解凍。歸檔直讀適用於即時讀取極少需要訪問的資料情境。

前提條件

使用限制

歸檔直讀僅適用於OSS-HDFS服務Bucket中Archive Storage類型的檔案,不適用於其他儲存類型的檔案。

費用說明

  • 為Bucket開啟歸檔直讀後,直接讀取Bucket中未解凍的Archive Storage類型檔案,會產生歸檔直讀資料取回容量(RetrievalDataArchiveDirect)費用,請求產生的歸檔直讀取回容量通過日誌欄位archive_direct_read_size的值來表示。對於已解凍的Archive Storage類型檔案,直接讀取不會產生歸檔直讀資料取回容量費用。詳情請參見資料處理費用

  • 歸檔直讀資料取回量取決於與HTTP建立串連時要求標頭中指定的資料讀取範圍。傳輸串連的提前斷開不會影響已發起請求的歸檔直讀資料取回容量。例如,實際讀取1位元組資料後中斷串連,但是請求範圍為100 MB~200 MB,將按照100 MB~200 MB計算歸檔直讀資料取回容量。

操作步驟

  1. 串連ECS執行個體。具體操作,請參見串連ECS執行個體

  2. 下載Jindofs SDK

  3. 配置存取金鑰和環境變數。

    1. 進入已安裝的Jindofs JAR包下的bin目錄。

      以下以jindofs-sdk-x.x.x-linux為例,如使用其他版本的JindoSDK,請替換為對應的JAR包名稱。

      cd jindofs-sdk-x.x.x-linux/bin/
    2. 在bin目錄下建立設定檔jindofs.cfg,並配置阿里雲帳號的存取金鑰(包括Accesskey ID和Accesskey Secret),或者滿足許可權要求的RAM使用者的存取金鑰。

      [client]
      fs.oss.accessKeyId = <key>              
      fs.oss.accessKeySecret = <secret>
    3. 設定環境變數。

      說明

      <JINDOSDK_CONF_DIR>填寫jindofs.cfg設定檔所在的絕對路徑。

      export JINDOSDK_CONF_DIR=<JINDOSDK_CONF_DIR>
  4. 為Bucket開啟歸檔直讀功能。

    以下樣本用於為華東(上海)地區的examplebucket開啟歸檔直讀功能。其他地區的Bucket,請對應替換Region和Bucket名稱。

    ./jindofs admin -putConfig -dlsUri oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/ -conf namespace.archive.directread.enable=true
  5. 查看Bucket歸檔直讀配置資訊。

    ./jindofs admin -getConfig -dlsUri oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/ -name namespace.archive.directread.enable

    返回資訊如下,說明Bucket已開啟歸檔直讀功能。

    namespace.archive.directread.enable: true

後續步驟

為Bucket開啟歸檔直讀後,您無需解凍Bucket中的Archive Storage類型檔案,就可以直接對其進行涉及讀取的操作,包括下載檔案、查看檔案資訊、拷貝檔案的操作。

相關文檔

如果您未開啟歸檔直讀,需要先解凍,才能讀取Archive Storage類型檔案。如何解凍歸檔檔案,請參見臨時解凍歸檔檔案