本文介紹如何使用Data Transmission Service,依次將本地MongoDB分區叢集資料庫中的各個Shard節點,遷移至阿里雲MongoDB分區叢集執行個體來實現遷移上雲。通過DTS的增量遷移功能,可以實現在本地應用不停服的情況下,平滑完成資料庫的遷移上雲。
更多資料移轉和同步情境的解決方案,請參見MongoDB資料移轉和同步方案概覽。
前提條件
自建MongoDB和ApsaraDB for MongoDB支援的版本,請參見遷移方案概覽。
確保目標分區叢集執行個體中的Shard節點具備充足的儲存空間。
說明例如自建資料庫中有三個Shard節點,其中第二個Shard節點佔用的儲存空間最多(500GB),那麼分區叢集執行個體中的每個Shard節點的儲存空間均需要大於500GB。
遷移原理介紹
DTS通過遷移分區叢集中的每個Shard節點來實現分區叢集資料庫的整體遷移,您需要為每個Shard節點建立一個對應的資料移轉任務。
資料在目標MongoDB執行個體中的分布取決於您設定的片鍵,詳情請參見設定資料分區以充分利用Shard效能。
注意事項
DTS在執行全量資料移轉時將佔用源庫和目標庫一定的資源,可能會導致資料庫伺服器負載上升。如果資料庫業務量較大或伺服器規格較低,可能會加重資料庫壓力,甚至導致資料庫服務不可用。建議您在執行資料移轉前謹慎評估,在業務低峰期執行資料移轉。
MongoDB執行個體支援的版本與儲存引擎請參見版本及儲存引擎,如需跨版本或跨引擎遷移,請提前確認相容性。
由於DTS寫入資料的邏輯為並發寫入,所以會導致目標端佔用的儲存空間比源端大5%~10%。
請確保目標端MongoDB沒有與源端相同的主鍵(預設為_id),否則會導致資料丟失。若目標端有與源端相同的主鍵,請在不影響業務的前提條件下清空目標端的相關資料(刪掉目標端中與源端相同_id的文檔)。
不支援資料庫admin和local作為源和目標庫。
源MongoDB分區叢集執行個體的Mongos節點的數量不能超過10個。
費用說明
遷移類型 | 鏈路配置費用 | 公網流量費用 |
全量資料移轉 | 不收費。 | 通過公網將資料移轉出阿里雲時將收費,詳情請參見DTS產品定價。 |
增量資料移轉 | 收費,詳情請參見。DTS產品定價 |
遷移類型說明
全量資料移轉:將源MongoDB資料庫遷移對象的存量資料全部遷移到目標MongoDB資料庫中。
說明支援database、collection、index的遷移。
增量資料移轉:在全量遷移的基礎上,將源MongoDB資料庫的累加式更新資料同步到目標MongoDB資料庫中。
說明支援database、collection、index的建立和刪除操作的同步。
支援document的新增、刪除和更新操作的同步。
資料庫帳號的許可權要求
資料庫 | 全量資料移轉 | 增量資料移轉 |
自建MongoDB資料庫 | 待遷移庫的read許可權 | 待遷移庫、admin庫和local庫的read許可權 |
阿里雲MongoDB資料庫 | 目標庫的readWrite許可權 | 目標庫的readWrite許可權 |
資料庫帳號建立及授權方法:
自建MongoDB資料庫請參見MongoDB Create User說明。
阿里雲MongoDB執行個體請參見使用DMS管理MongoDB資料庫使用者。
準備工作
必需:為避免塊遷移對資料一致性的影響,遷移期間需要關閉自建MongoDB資料庫的均衡器(Balancer),詳情請參見管理MongoDB均衡器Balancer 。
警告如果未關閉均衡器,遷移期間發生了塊遷移將影響DTS讀取到的資料的一致性。
清除自建MongoDB資料庫中,因塊遷移失敗而產生的孤立文檔。
說明如果未清除孤立文檔,將影響遷移效能,而且可能在遷移過程會遇到
_id
衝突的文檔,導致遷移錯誤的資料。下載cleanupOrphaned.js指令檔。
wget "https://docs-aliyun.cn-hangzhou.oss.aliyun-inc.com/assets/attach/120562/cn_zh/1564451237979/cleanupOrphaned.js"
修改cleanupOrphaned.js指令檔,將
test
替換為待清理孤立文檔的資料庫名。說明如果您有多個資料庫,您需要重複執行本步驟和步驟c。
執行如下命令,清理Shard節點中指定資料庫下所有集合的孤立文檔。
說明您需要重複執行本步驟,為每個Shard節點清理孤立文檔。
mongo --host <Shardhost> --port <Primaryport> --authenticationDatabase <database> -u <username> -p <password> cleanupOrphaned.js
說明<Shardhost>:Shard節點的IP地址。
<Primaryport>:Shard節點中的Primary節點的服務連接埠。
<database>:鑒權資料庫名,即資料庫帳號所屬的資料庫。
<username>:登入資料庫的帳號。
<password>:登入資料庫的密碼。
樣本:
本案例的自建MongoDB資料庫有三個Shard節點,所以需要分別為這三個節點清除孤立文檔。
mongo --host 172.16.1.10 --port 27018 --authenticationDatabase admin -u dtstest -p 'Test123456' cleanupOrphaned.js
mongo --host 172.16.1.11 --port 27021 --authenticationDatabase admin -u dtstest -p 'Test123456' cleanupOrphaned.js
mongo --host 172.16.1.12 --port 27024 --authenticationDatabase admin -u dtstest -p 'Test123456' cleanupOrphaned.js
根據業務需要,在目標MongoDB執行個體中建立需要分區的資料庫和集合,並配置資料分區,詳情請參見設定資料分區以充分利用Shard效能。
說明在配置資料移轉前配置資料分區,可避免資料被遷移至同一Shard中,導致單個Shard使用的儲存空間超出預期規劃。
操作步驟
登入資料轉送控制台。
在左側導覽列,單擊資料移轉。
在遷移工作清單頁面頂部,選擇目標MongoDB執行個體所屬地區。
單擊右上方的建立遷移任務。
配置遷移任務的源庫及目標庫資訊。
類別
配置
說明
無
任務名稱
DTS會自動產生一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便於後續識別。
源庫資訊
執行個體類型
根據源庫的部署位置進行選擇,本文以有公網IP的自建資料庫為例介紹配置流程。
說明當自建資料庫為其他執行個體類型時,您還需要執行相應的準備工作,詳情請參見準備工作概覽。
執行個體地區
當執行個體類型選擇為有公網IP的自建資料庫時,執行個體地區無需設定。
說明如果您的自建資料庫具備白名單安全類設定,您需要在執行個體地區配置項後,單擊擷取DTS IP段來擷取DTS伺服器的IP地址,並將擷取到的IP地址加入自建資料庫的白名單安全設定中。
資料庫類型
選擇MongoDB。
主機名稱或IP地址
填入自建MongoDB資料庫中,單個Shard節點的網域名稱或IP地址,本案例填入公網IP地址。
說明DTS通過依次遷移分區叢集中的每個Shard節點來實現整體遷移,此處先填入第一個Shard節點的網域名稱或IP地址,稍後建立第二個遷移任務時,此處填入第二個Shard節點的網域名稱或IP地址。以此類推,直至遷移所有Shard節點。
連接埠
填入對應Shard節點的服務連接埠。
說明本案例中,各Shard節點的服務連接埠須開放至公網。
資料庫名稱
填入鑒權資料庫名,即資料庫帳號所屬的資料庫。
資料庫帳號
填入自建MongoDB資料庫的資料庫帳號,許可權要求請參見資料庫帳號的許可權要求。
資料庫密碼
填入該資料庫帳號對應的密碼。
說明源庫資訊填寫完畢後,您可以單擊資料庫密碼後的測試連接來驗證填入的源庫資訊是否正確。源庫資訊填寫正確則提示測試通過,如提示測試失敗,單擊測試失敗後的診斷,根據提示調整填寫的源庫資訊。
串連方式
選擇非加密串連。
說明只有在遷移MongoDB Atlas資料庫時,才能選擇SSL安全連線。
目標庫資訊
執行個體類型
選擇MongoDB執行個體。
執行個體地區
選擇目標MongoDB執行個體所在地區。
MongoDB執行個體ID
選擇目標分區叢集執行個體ID。
資料庫名稱
填入鑒權資料庫名,即資料庫帳號所屬的資料庫。
資料庫帳號
填入MongoDB執行個體的資料庫帳號,許可權要求請參見資料庫帳號的許可權要求。
資料庫密碼
填入該資料庫帳號對應的密碼。
說明目標庫資訊填寫完畢後,您可以單擊資料庫密碼後的測試連接來驗證填入的目標庫資訊是否正確。目標庫資訊填寫正確則提示測試通過,如提示測試失敗,單擊測試失敗後的診斷,根據提示調整填寫的目標庫資訊。
配置完成後,單擊頁面右下角的授權白名單並進入下一步。
如果源或目標資料庫是阿里雲資料庫執行個體(例如RDS MySQL、ApsaraDB for MongoDB等),DTS會自動將對應地區DTS服務的IP地址添加到阿里雲資料庫執行個體的白名單;如果源或目標資料庫是ECS上的自建資料庫,DTS會自動將對應地區DTS服務的IP地址添到ECS的安全規則中,您還需確保自建資料庫沒有限制ECS的訪問(若資料庫是叢集部署在多個ECS執行個體,您需要手動將DTS服務對應地區的IP地址添到其餘每個ECS的安全規則中);如果源或目標資料庫是IDC自建資料庫或其他雲資料庫,則需要您手動添加對應地區DTS服務的IP地址,以允許來自DTS伺服器的訪問。DTS服務的IP地址,請參見DTS伺服器的IP位址區段。
警告DTS自動添加或您手動添加DTS服務的公網IP位址區段可能會存在安全風險,一旦使用本產品代表您已理解和確認其中可能存在的安全風險,並且需要您做好基本的安全防護,包括但不限於加強帳號密碼強度防範、限制各網段開放的連接埠號碼、內部各API使用鑒權方式通訊、定期檢查並限制不需要的網段,或者使用通過內網(專線/VPN網關/智能網關)的方式接入。
選擇遷移對象和遷移類型。
配置
說明
遷移類型
如果只需要進行全量遷移,則勾選全量資料移轉。
如果需要進行不停機遷移,則同時勾選全量資料移轉和增量資料移轉。
說明如果未勾選增量資料移轉,為保障資料一致性,資料移轉期間請勿在自建MongoDB資料庫中寫入新的資料。
遷移對象
在遷移對象框中單擊待遷移的對象,然後單擊
表徵圖將其移動到已選擇對象框。
說明不支援遷移admin、local、config資料庫。
遷移對象選擇的粒度為database、collection或function。
預設情況下,遷移完成後,遷移對象的名稱保持不變。如果您需要改變遷移對象在目標資料庫中的名稱,那麼需要使用DTS提供的對象名映射功能。使用方法請參見庫表列映射。
映射名稱更改
如需更改遷移對象在目標執行個體中的名稱,請使用對象名映射功能,詳情請參見庫表列映射。
源、目標庫無法串連重試時間
預設重試12小時,您也可以自訂重試時間。如果DTS在設定的時間內重新串連上源、目標庫,遷移任務將自動回復。否則,遷移任務將失敗。
說明由於串連重試期間,DTS將收取任務運行費用,建議您根據業務需要自訂重試時間,或者在源和目標庫執行個體釋放後儘快釋放DTS執行個體。
上述配置完成後,單擊頁面右下角的預檢查並啟動。
說明在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過後,才能成功啟動遷移任務。
如果預檢查失敗,單擊具體檢查項後的
,查看失敗詳情。
您可以根據提示修複後重新進行預檢查。
如無需修複警示檢測項,您也可以選擇確認屏蔽、忽略警示項並重新進行預檢查,跳過警示檢測項重新進行預檢查。
預檢查通過後,單擊下一步。
在購買配置確認頁面,選擇鏈路規格並選中資料轉送(隨用隨付)服務條款。
單擊購買並啟動,遷移任務正式開始。
重複第1步到第11步的操作,為剩餘的Shard節點建立遷移任務。
完成遷移任務。
全量資料移轉
請勿手動結束遷移任務,否則可能會導致資料不完整。您只需等待遷移任務完成即可,遷移任務會自動結束。
增量資料移轉
遷移任務不會自動結束,需要手動結束遷移任務。
說明請選擇合適的時間手動結束遷移任務,例如業務低峰期或準備將業務切換至MongoDB執行個體時。
等待所有Shard節點的遷移任務的進度變更為增量遷移,並顯示為無延遲狀態時,將源庫停寫幾分鐘,此時增量遷移的狀態可能會顯示延遲的時間。
等待所有Shard節點遷移任務的增量遷移再次進入無延遲狀態後,手動結束遷移任務。
將業務切換至阿里雲MongoDB執行個體。