全部產品
Search
文件中心

Data Transmission Service:從自建PostgreSQL(10.1~13版本)增量遷移至RDS PostgreSQL

更新時間:Jul 06, 2024

本文介紹如何使用Data Transmission Service,將自建PostgreSQL或RDS PostgreSQL執行個體增量遷移至自建PostgreSQL或RDS PostgreSQL執行個體。DTS支援結構遷移、全量資料移轉和增量資料移轉,同時使用這三種遷移類型可以實現在自建應用不停服的情況下,平滑地完成資料庫遷移。本文介紹自建PostgreSQL增量遷移至RDS PostgreSQL的配置方式。

前提條件

  • 自建PostgreSQL的資料庫版本為10.1~13版本。
  • 已建立RDS PostgreSQL,詳情請參見建立RDS PostgreSQL執行個體
    說明 為保障相容性,建議RDS PostgreSQL的資料庫版本與自建PostgreSQL的資料庫版本相同。
  • RDS PostgreSQL執行個體的儲存空間須大於自建PostgreSQL資料庫佔用的儲存空間。

注意事項

  • DTS在執行全量資料移轉時將佔用源庫和目標庫一定的讀寫資源,可能會導致資料庫的負載上升,在資料庫效能較差、規格較低或業務量較大的情況下(例如源庫有大量慢SQL、存在無主鍵表或目標庫存在死結等),可能會加重資料庫壓力,甚至導致資料庫服務不可用。因此您需要在執行資料移轉前評估源庫和目標庫的效能,同時建議您在業務低峰期執行資料移轉(例如源庫和目標庫的CPU負載在30%以下)。

  • 如果源庫中待遷移的表沒有主鍵或唯一約束,且所有欄位沒有唯一性,可能會導致目標資料庫中出現重複資料。

  • 在增量資料移轉過程中,如果遷移對象的選擇粒度為Schema,在待遷移的Schema中建立了新的表或使用RENAME命令重建了待遷移的表,您需要在對該表寫入資料前執行ALTER TABLE schema.table REPLICA IDENTITY FULL;命令。
    說明 將上述命令中的schematable替換成真實的Schema名和表名。
  • 為保障增量資料移轉延遲時間展示的準確性,DTS會在源庫中新增一個名為dts_postgres_heartbeat的心跳錶。
  • 在增量資料移轉的過程中,DTS會在源庫中建立首碼為dts_sync_的replication slot用於複製資料。DTS會每隔90分鐘自動清理一次歷史replication slot,避免其持續累積佔用磁碟空間。
    說明 當釋放遷移任務或遷移失敗時,DTS會主動清理該replication slot;如果RDS PostgreSQL發生了主備切換,則需要您登入備庫來手動清理。
    Amazon slot查詢資訊
  • 為保障遷移任務的正常進行,目前僅支援RDS PostgreSQL 11進行主備切換,且需設定參數 rds_failover_slot_modesync,設定方式,請參見邏輯複製槽容錯移轉(Logical Replication Slot Failover)
    警告 自建PostgreSQL和其他版本的RDS PostgreSQL進行主備切換,會導致遷移中斷。
  • 對於遷移失敗的任務,DTS會觸發自動回復。當您需要將業務切換至目標執行個體,請務必先終止或釋放該任務,避免該任務被自動回復後,導致源端資料覆蓋目標執行個體的資料。
  • 若源庫有長事務,且執行個體包含增量遷移任務,則可能會導致源庫長事務提交前的預寫記錄檔WAL(Write-Ahead Logging)無法清理而堆積,從而造成源庫磁碟空間不足。

遷移限制

  • 一個資料移轉任務只能對一個資料庫進行資料移轉,如果有多個資料庫需要遷移,則需要為每個資料庫建立資料移轉任務。
  • 待遷移的資料庫名稱中間不能包含短劃線(-),例如dts-testdata。
  • 如果遷移過程中源庫發生了主備切換,DTS的增量資料移轉無法實現斷點續傳。
  • 由於源庫的主備節點可能存在同步延遲導致資料不一致,執行資料移轉時請使用源庫的主節點作為遷移的資料來源。
    說明 為避免資料移轉對業務的影響,請在業務低峰期執行資料移轉,您還可以根據源庫的讀寫壓力情況調整遷移速率,詳情請參見調整全量遷移速率
  • 增量資料移轉階段不支援遷移bit類型的資料。
  • 增量資料移轉階段僅支援DML操作(INSERT、DELETE、UPDATE)的同步。
    說明 僅2020年10月1日後建立的資料移轉任務支援同步DDL操作,您需要在配置遷移任務前,在源庫中建立觸發器和函數來捕獲DDL資訊,詳情請參見通過觸發器和函數實現PostgreSQL的DDL增量遷移
  • 由於業務切換到目標端後,新寫入的Sequence不會按照源庫的Sequence最大值作為初始值去遞增,您需要在業務切換前,在源庫中查詢對應Sequence的最大值,然後在目標庫中將其作為對應Sequence的初始值。
  • DTS的校正對象為資料內容,暫不支援Sequence等中繼資料的校正,您需要自行校正。

費用說明

遷移類型

鏈路配置費用

公網流量費用

結構遷移和全量資料移轉

不收費。

通過公網將資料移轉出阿里雲時將收費,詳情請參見計費概述

增量資料移轉

收費,詳情請參見計費概述

資料庫帳號的許可權要求

資料庫結構遷移全量遷移增量遷移
自建PostgreSQL資料庫pg_catalog的usage許可權遷移對象的select許可權superuser
RDS PostgreSQL執行個體遷移對象的create、usage許可權schema的owner許可權schema的owner許可權

資料庫帳號建立及授權方法:

資料移轉流程說明

為解決對象間的依賴,提高遷移成功率,DTS對PostgreSQL結構及資料的遷移順序如下表所示。

說明 關於結構遷移、全量資料移轉、增量資料移轉的術語介紹,請參見基本概念
DTS自動執行的遷移流程遷移說明
1.結構遷移DTS遷移TABLE、VIEW、SEQUENCE、FUNCTION、USER DEFINED TYPE、RULE、DOMAIN、OPERATION、AGGREGATE的結構資訊至目標庫。
說明 不支援遷移外掛程式、使用C語言編寫的FUNCTION。
2.全量資料移轉DTS將遷移對象的存量資料全部遷移至目標庫。
3.結構遷移DTS遷移TRIGGER、FOREIGN KEY的結構資訊至目標庫。
4.增量資料移轉在全量資料移轉的基礎上,DTS將遷移對象的累加式更新遷移至目標庫。通過增量資料移轉可以實現在自建應用不停服的情況下,平滑地完成資料移轉。
說明
  • 增量資料移轉階段僅支援DML操作(INSERT、DELETE、UPDATE)的同步。
  • 增量資料移轉階段不支援遷移bit類型的資料。

準備工作

  1. 登入自建PostgreSQL所屬的伺服器。
  2. 修改設定檔postgresql.conf,將設定檔中的wal_level設定為logical
    設定wal_level
    說明
    • 設定檔修改完成後,您需要執行SELECTpg_reload_conf();命令或重啟自建PostgreSQL使參數生效。
    • 如果不需要增量資料移轉,可跳過本步驟。
  3. 將DTS的IP地址加入至自建PostgreSQL的設定檔pg_hba.conf中。您只需添加目標資料庫所在地區對應的DTS IP位址區段,詳情請參見添加DTS伺服器的IP位址區段
    說明 關於該設定檔的設定請參見pg_hba.conf檔案。如果您已將信任地址配置為0.0.0.0/0(如下圖所示),可跳過本步驟。
  4. 可選:在源庫中建立觸發器和函數來捕獲DDL資訊實現DDL操作的同步,詳情請參見通過觸發器和函數實現PostgreSQL的DDL增量遷移
    說明 如果無需同步DDL操作,可跳過本步驟。

操作步驟

  1. 登入資料轉送控制台

    說明

    若資料轉送控制台自動跳轉至Data Management控制台,您可以在右下角的jiqiren中單擊返回舊版,返回至舊版資料轉送控制台。

  2. 在左側導覽列,單擊資料移轉

  3. 遷移工作清單頁面頂部,選擇遷移的目的地組群所屬地區。

  4. 單擊頁面右上方的建立遷移任務

  5. 配置遷移任務的源庫及目標庫資訊。
    源庫和目標庫串連配置
    類別配置說明
    任務名稱DTS會自動產生一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便於後續識別。
    源庫資訊執行個體類型根據源庫的部署位置進行選擇,本文以有公網IP的自建資料庫為例介紹配置流程。
    說明 當自建資料庫為其他執行個體類型時,您還需要執行相應的準備工作,詳情請參見準備工作概覽
    執行個體地區當執行個體類型選擇為有公網IP的自建資料庫時,執行個體地區無需設定。
    資料庫類型選擇PostgreSQL
    主機名稱或IP地址填入自建PostgreSQL資料庫的訪問地址,本案例中填入公網地址。
    連接埠填入自建PostgreSQL資料庫的服務連接埠(該連接埠須開放至公網)。
    資料庫名稱填入自建PostgreSQL資料庫中待遷移的資料庫名。
    資料庫帳號填入自建PostgreSQL的資料庫帳號,許可權要求請參見資料庫帳號的許可權要求
    資料庫密碼填入該資料庫帳號對應的密碼。
    說明

    源庫資訊填寫完畢後,您可以單擊資料庫密碼後的測試連接來驗證填入的源庫資訊是否正確。源庫資訊填寫正確則提示測試通過;如果提示測試失敗,單擊測試失敗後的診斷,根據提示調整填寫的源庫資訊。

    目標庫資訊執行個體類型選擇RDS執行個體
    執行個體地區選擇目標RDS執行個體所屬地區。
    RDS執行個體ID選擇目標RDS執行個體ID。
    資料庫名稱填入RDS執行個體中待遷入資料的資料庫名,可以和源庫的庫名不同。
    說明 該資料庫須在阿里雲RDS中存在,如不存在請建立資料庫
    資料庫帳號填入RDS的資料庫帳號,許可權要求請參見資料庫帳號的許可權要求
    資料庫密碼填入該資料庫帳號對應的密碼。
    說明

    目標庫資訊填寫完畢後,您可以單擊資料庫密碼後的測試連接來驗證填入的目標庫資訊是否正確。目標庫資訊填寫正確則提示測試通過;如果提示測試失敗,單擊測試失敗後的診斷,根據提示調整填寫的目標庫資訊。

  6. 配置完成後,單擊頁面右下角的授權白名單並進入下一步
    如果源或目標資料庫是阿里雲資料庫執行個體(例如RDS MySQLApsaraDB for MongoDB等),DTS會自動將對應地區DTS服務的IP地址添加到阿里雲資料庫執行個體的白名單;如果源或目標資料庫是ECS上的自建資料庫,DTS會自動將對應地區DTS服務的IP地址添到ECS的安全規則中,您還需確保自建資料庫沒有限制ECS的訪問(若資料庫是叢集部署在多個ECS執行個體,您需要手動將DTS服務對應地區的IP地址添到其餘每個ECS的安全規則中);如果源或目標資料庫是IDC自建資料庫或其他雲資料庫,則需要您手動添加對應地區DTS服務的IP地址,以允許來自DTS伺服器的訪問。DTS服務的IP地址,請參見DTS伺服器的IP位址區段
    警告

    DTS自動添加或您手動添加DTS服務的公網IP位址區段可能會存在安全風險,一旦使用本產品代表您已理解和確認其中可能存在的安全風險,並且需要您做好基本的安全防護,包括但不限於加強帳號密碼強度防範、限制各網段開放的連接埠號碼、內部各API使用鑒權方式通訊、定期檢查並限制不需要的網段,或者使用通過內網(專線/VPN網關/智能網關)的方式接入。

  7. 選擇遷移類型和遷移對象。
    選擇遷移類型和遷移對象
    配置說明
    遷移類型
    • 如果只需要進行全量資料移轉,則同時選中結構遷移全量資料移轉
    • 如果需要進行不停機遷移,則同時選中結構遷移全量資料移轉增量資料移轉。本案例中同時選中這三個遷移類型。
    說明 如果沒有選中增量資料移轉,為保障資料一致性,資料移轉期間請勿在源庫中寫入新的資料。
    遷移對象

    遷移對象框中單擊待遷移的對象,然後單擊向右小箭頭表徵圖將其移動至已選擇對象框。

    說明
    • 遷移對象選擇的粒度為Schema、表、列。
    • 預設情況下,遷移完成後,遷移對象名跟自建PostgreSQL資料庫一致。如果您需要變更遷移對象在目標RDS執行個體中的名稱,那麼需要使用對象名映射功能,詳情請參見庫表列映射
    • 如果使用了對象名映射功能,可能會導致依賴該對象的其他對象遷移失敗。
    映射名稱更改如需更改遷移對象在目標執行個體中的名稱,請使用對象名映射功能,詳情請參見庫表列映射
    源、目標庫無法串連重試時間預設重試12小時,您也可以自訂重試時間。如果DTS在設定的時間內重新串連上源、目標庫,遷移任務將自動回復。否則,遷移任務將失敗。
    說明 由於串連重試期間,DTS將收取任務運行費用,建議您根據業務需要自訂重試時間,或者在源和目標庫執行個體釋放後儘快釋放DTS執行個體。
  8. 上述配置完成後,單擊頁面右下角的預檢查並啟動

    說明
    • 在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過後,才能成功啟動遷移任務。

    • 如果預檢查失敗,單擊具體檢查項後的提示,查看失敗詳情。

      • 您可以根據提示修複後重新進行預檢查。

      • 如無需修複警示檢測項,您也可以選擇確認屏蔽忽略警示項並重新進行預檢查,跳過警示檢測項重新進行預檢查。

  9. 預檢查通過後,單擊下一步

  10. 在彈出的購買配置確認對話方塊,選擇鏈路規格並選中資料轉送(隨用隨付)服務條款

  11. 單擊購買並啟動,遷移任務正式開始。

結束遷移任務

警告 為儘可能地減少業務切換帶來的影響,您可以建立回退方案(將目標庫的增量資料即時移轉回源庫),詳情請參見業務切換流程。如果不涉及業務切換,您可以結束遷移任務。
  • 全量資料移轉

    請勿手動結束遷移任務,否則可能導致資料不完整。您只需等待遷移任務完成即可,遷移任務會自動結束。

  • 增量資料移轉

    遷移任務不會自動結束,您需要手動結束遷移任務。

    1. 觀察遷移任務的進度變更為增量遷移,並顯示為無延遲狀態時,將源庫停寫幾分鐘,此時增量遷移的狀態可能會顯示延遲的時間。
    2. 等待遷移任務的增量遷移再次進入無延遲狀態後,手動結束遷移任務。結束增量遷移任務