本文針對檔案的傳輸情境,介紹如何使用Python SDK V2新增的下載管理員Downloader模組進行檔案下載。
注意事項
本文範例程式碼以華東1(杭州)的地區ID
cn-hangzhou為例,預設使用外網Endpoint,如果您希望通過與OSS同地區的其他阿里雲產品訪問OSS,請使用內網Endpoint。關於OSS支援的Region與Endpoint的對應關係,請參見OSS地區和訪問網域名稱。要進行檔案下載,您必須有
oss:GetObject許可權。具體操作,請參見為RAM使用者授予自訂的權限原則。
方法定義
下載管理員功能簡介
Python SDK V2新增下載管理員Downloader提供了通用的下載方法,隱藏了底層方法的實現細節,提供便捷的檔案下載能力。
下載管理員Downloader底層利用範圍下載,把檔案自動分成多個較小的分區進行並發下載,提升下載的效能。
下載管理員Downloader同時提供了斷點續傳的能力,即在下載過程中,記錄已完成的分區狀態,如果出現網路中斷、程式異常退出等問題導致檔案下載失敗,甚至重試多次仍無法完成下載,再次下載時,可以通過斷點記錄檔案恢複下載。
下載管理員Downloader的常用方法如下:
class Downloader:
...
def downloader(self, **kwargs) -> Downloader:
...
def download_file(self, request: models.GetObjectRequest, filepath: str, **kwargs: Any) -> DownloadResult:
...
def download_to(self, request: models.GetObjectRequest, writer: IO[bytes], **kwargs: Any) -> DownloadResult:
...請求參數列表
參數名 | 類型 | 說明 |
request | GetObjectRequest | 下載對象的請求參數,和GetObject 方法的請求參數一致,具體請參見GetObjectRequest |
filepath | str | 本地檔案路徑 |
writer | IO[bytes] | 下載的流 |
**kwargs | Any | (可選)任意參數,類型為字典 |
返回參數列表
類型 | 說明 |
DownloadResult | 下載對象的返回參數,具體請參見DownloadResult |
當您使用client.downloader初始化下載管理員執行個體時,您可以指定多個配置選項來自訂下載行為,也可以在每次調用下載介面時,指定多個配置選項來自訂每次下載對象的行為。例如指定分區大小如下所示。
設定downloader的配置參數
downloader = client.downloader(part_size=1024 * 1024)設定每次下載請求的配置參數
result = downloader.download_file(oss.GetObjectRequest( bucket="example_bucket", key="example_key", ), filepath="/local/dir/example", part_size=10 * 1024 * 1024, )
常用的配置選項說明列舉如下:
參數名 | 類型 | 說明 |
part_size | int | 指定分區大小,預設值為 6MiB |
parallel_num | int | 指定下載任務的並發數,預設值為 3。針對的是單次調用的並發限制,而不是全域的並發限制 |
enable_checkpoint | bool | 是否開啟斷點下載功能,預設不開啟 |
checkpoint_dir | str | 指定記錄檔案的儲存路徑,例如 /local/dir/, 當enable_checkpoint 為True時有效 |
verify_data | bool | 恢複下載時,是否要校正已下載資料的CRC64值,預設不校正, 當enable_checkpoint 為True時有效 |
use_temp_file | bool | 下載檔案時,是否使用臨時檔案,預設使用。先下載到臨時檔案上,當成功後,再重新命名為目標檔案 |
關於檔案下載管理員方法的完整定義,請參見Downloader。
範例程式碼
您可以使用以下代碼將儲存空間中的檔案下載到本地。
import argparse
import alibabacloud_oss_v2 as oss
# 建立一個命令列參數解析器,並描述指令碼用途:下載檔案樣本
parser = argparse.ArgumentParser(description="download file sample")
# 添加命令列參數 --region,表示儲存空間所在的地區,必需參數
parser.add_argument('--region', help='The region in which the bucket is located.', required=True)
# 添加命令列參數 --bucket,表示要下載檔案的儲存空間名稱,必需參數
parser.add_argument('--bucket', help='The name of the bucket.', required=True)
# 添加命令列參數 --endpoint,表示其他服務可用來訪問OSS的網域名稱,非必需參數
parser.add_argument('--endpoint', help='The domain names that other services can use to access OSS')
# 添加命令列參數 --key,表示對象(檔案)在OSS中的鍵名,必需參數
parser.add_argument('--key', help='The name of the object.', required=True)
# 添加命令列參數 --file_path,表示下載檔案儲存的本地路徑,必需參數,例如“/Users/yourLocalPath/yourFileName”
parser.add_argument('--file_path', help='The path to save the downloaded file.', required=True)
def main():
# 解析命令列提供的參數,擷取使用者輸入的值
args = parser.parse_args()
# 從環境變數中載入訪問OSS所需的認證資訊,用於身分識別驗證
credentials_provider = oss.credentials.EnvironmentVariableCredentialsProvider()
# 使用SDK的預設配置建立設定物件,並設定認證提供者
cfg = oss.config.load_default()
cfg.credentials_provider = credentials_provider
# 設定設定物件的地區屬性,根據使用者提供的命令列參數
cfg.region = args.region
# 如果提供了自訂endpoint,則更新設定物件中的endpoint屬性
if args.endpoint is not None:
cfg.endpoint = args.endpoint
# 使用上述配置初始化OSS用戶端,準備與OSS互動
client = oss.Client(cfg)
# 建立一個用於下載檔案的對象
downloader = client.downloader()
# 調用方法執行檔案下載操作
result = downloader.download_file(
oss.GetObjectRequest(
bucket=args.bucket, # 指定目標儲存空間
key=args.key, # 指定檔案在OSS中的名稱
),
filepath=args.file_path # 指定下載檔案儲存的本地路徑
)
# 列印下載結果的相關資訊,包括已寫入的位元組數
print(f'written: {result.written}')
# 當此指令碼被直接執行時,調用main函數開始處理邏輯
if __name__ == "__main__":
main() # 指令碼進入點,控製程序流程從這裡開始常見使用情境
相關文檔
關於下載管理員的更多資訊,請參見開發人員指南。
關於下載管理員的完整樣本,請參見download_file.py。