全部產品
Search
文件中心

MaxCompute:配置BigQuery資料來源

更新時間:Mar 04, 2026

通過資料移轉服務MMS(MaxCompute Migration Service)遷移資料前,需新增並啟動BigQuery資料來源,確保資料來源與MMS服務網路連通,並將BigQuery的中繼資料同步至MMS服務,以便配置後續的遷移作業。

遷移費用

MMS資料移轉會消耗各類資源從而產生消費,主要組成費用如下:

MMS操作

計費項目

收費方

  • 資料來源運行過程(包括中繼資料同步)

  • 任務遷移資料過程

計算費用:MaxCompute端產生Spark作業消耗計算資源

阿里雲

MaxCompute

源端資料存放區

儲存費用:若使用OSS/S3等Object Storage Service,源端訪問隱藏檔時產生。

BigQuery

若遷移任務配置了“開啟校正”

計算費用:在Hive和MaxCompute分別執行校正SQL語句產生。

阿里雲

MaxCompute和BigQuery

網路設定

網路費用

  • 若有網路專線則收取專線相關費用

  • 若無網路專線則產生資料出Google雲的流量費用

專線提供方或阿里雲網路

建議選擇訂用帳戶的計算資源和資料轉送獨享資源來執行遷移作業,以便降低遷移成本。

操作步驟

目標端MaxCompute專案已完成準備工作

步驟一:外部資料源準備

在源端BigQuery,完成以下操作:

  1. 已建立BigQuery服務帳號,並已下載鑒權JSON。

  2. 已建立BigQuery專案,並已經將該專案相關的讀中繼資料、資料等許可權授權給該BigQuery服務帳號。

步驟二:新增資料來源

  1. 登入MaxCompute控制台,在左上方選擇地區。

  2. 在左側導覽列,選擇数据传输 > 迁移服务

  3. 数据源頁簽,單擊新增数据源

    在彈出的MaxCompute服务关联角色對話方塊中,單擊确认,即可建立成功。若未自動彈出該對話方塊,則表明該角色已建立。

    新增数据源頁面,配置資料來源資訊,然後單擊新增,完成資料來源建立。

    • 資料來源基本資料

      參數名

      是否必填

      說明

      資料來源名稱

      資料來源名稱,可自訂,不能包含字元、數字、漢字之外的特殊字元。

      資料來源類型

      選擇BigQuery

      网络连接

      選擇需要使用的網路連接。

      網路連接在MaxCompute管理配置 > 网络连接 模組建立,用於MMS與VPC通訊,最終串連資料來源。

      服務帳號密鑰檔案

      BigQuery服務帳號的密鑰檔案。

      可以通過BigQuery IAM控制台建立服務帳號,下載鑒權JSON檔案,詳情請參見服務帳號概述

      專案 ID

      待遷移的BigQuery專案名稱。

      預設目標MaxCompute專案

      資料移轉時選擇映射的目標專案,不可修改。

      目標MaxCompute專案列表

      若一個資料來源的資料需要遷移到多個目標專案,需配置目標MaxCompute專案列表。

      MaxCompute執行遷移作業的專案

      遷移過程中,執行在MaxCompute上發起的Spark、SQL等遷移作業的專案,並使用該專案關聯的預設計算Quota。

    • 其他資訊

      以下參數均非必填,根據需要填寫。

      參數名

      說明

      定界分割表遷移方式

      BigQuery定界分割表遷移方式。

      • 預設值為Partition

      • Cluster

      壓縮類型

      BigQuery資料的壓縮類型

      Bignumeric 類型預設 precision

      BigQuery Bignumeric類型資料的精度值,預設值為38。

      Bignumeric 類型預設 scale

      BigQuery Bignumeric類型資料的小數位元,預設值為18。

      MC Auto Partition

      自動分區(暫不支援,請先關閉)。

      Force the Use of Append 2.0 Table

      強制目標表使用Append2.0(暫不支援,請先關閉)。

      BigQuery Execution Project

      BigQuery端執行作業的Project名稱。

      Metastore定時更新

      資料來源中繼資料是否定時拉取。取值說明如下:

      • 啟用:定時拉取,更新周期支援每天和每小時,支援配置更新开始时间

        • 每日更新:定時器每天運行一次,運行時刻為選定的24小時內的某一時間(精確到分鐘)。

        • 每小时更新:定時器每小時運行一次,運行時刻為選定的60分鐘內的某一分鐘。

      • 禁用:不定時拉取。

      Metastore訪問並發量

      訪問MaxCompute MetaStore的並發量,用於提高擷取MaxCompute中繼資料的速度。

      庫白名單

      需要遷移的BigQuery資料庫,多個庫之間以半形逗號(,)分隔。

      庫黑名單

      不需要遷移的BigQuery資料庫,多個庫之間以半形逗號(,)分隔。

      表黑名單

      不需要遷移的BigQuery資料表。

      單個表的格式為dbname.tablename,多個表之間以半形逗號(,)分隔。

      表白名單

      需要遷移的BigQuery資料表。

      單個表的格式為dbname.tablename,多個表之間以半形逗號(,)分隔。

      資料搬遷任務最大並發量

      根據需要配置。

      MaxCompute遷移任務sql參數

      SQL參數。參考Flag參數列表

      表名字元轉換配置

      表名字元對應表,如BigQuery的表名中的中劃線-映射為MaxCompute表名底線_

步驟三:同步中繼資料

資料來源啟動後會產生一個工作執行個體,實現資料來源與MMS服務的串連,再將來源資料同步至MMS服務,以便配置後續遷移作業。

說明

該工作執行個體會佔用4 CU計算資源。當資料來源無任何等待運行或正在啟動並執行遷移作業或中繼資料同步作業時,系統會關閉資料來源,使用時需再次啟動。

  1. 数据源頁簽,單擊目標資料來源對應的操作列的更新元数据

  2. 数据源頁簽,可以查看目標資料來源的運行状态

  3. 若資料來源的中繼資料存在變動,且啟用了中繼資料定時更新,系統會按照配置的時間定時更新,無需手動進行中繼資料同步操作。

外部資料源配置完成後,建立遷移作業