MongoDB是目前仅次于Oracle、MySQL的文档型数据库,为您提供读取和写入MongoDB双向通道的功能,您可以通过脚本模式配置同步任务。

背景信息

标准模式的工作空间支持数据源隔离功能,您可以分别添加并隔离开发环境和生产环境的数据源,以保护您的数据安全。详情请参见数据源开发和生产环境隔离

使用限制

如果MongoDB为分片集群,则在配置数据源时,需要配置mongos地址,避免配置mongod/shard节点地址。否则同步任务在抽取MongoDB中数据时,可能会导致只查询到指定shard的数据,而非预期的全集。关于mongosmongod,详情请参考mongosmongod

操作步骤

  1. 进入数据源管理页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,鼠标悬浮至图标图标,单击工作空间配置
    4. 在左侧导航栏,单击数据源管理,进入数据源管理页面。
    说明 您也可以在数据集成页面进入数据源管理配置数据源,但此方式只支持生产环境的数据源。
  2. 数据源管理页面,单击右上角的新增数据源
  3. 新增数据源对话框中,选中数据源类型为MongoDB
  4. 新增MongoDB数据源对话框中,配置各项参数。
    MongoDB数据源包括阿里云实例模式连接串模式两种类型:
    说明 如果DataWorks和MongoDB数据源不在同一个阿里云主账号名下,需要使用连接串模式。
    • 阿里云实例模式:通常使用经典网络类型,同区域的经典网络可以连通,跨区域的经典网络不保证可以连通。
      参数描述
      数据源类型当前选择的数据源类型为阿里云实例模式
      说明 如果您尚未授权数据集成系统默认角色,需要主账号前往RAM进行角色授权后,再刷新该页面。
      数据源名称数据源名称必须以字母、数字、下划线(_)组合,且不能以数字和下划线(_)开头。
      数据源描述对数据源进行简单描述,不得超过80个字符。
      适用环境可以选择开发生产环境。
      说明 仅标准模式工作空间会显示该配置。
      地域购买MongoDB时选择的区域。
      实例ID您可以在MongoDB控制台查看MongoDB实例ID。
      授权使用数据库输入授权使用的数据库名称。
      数据库名您可以在MongoDB控制台新建数据库,设置相应的数据名、用户名和密码。
      用户名数据库对应的用户名。
      密码数据库对应的密码。
      鉴权数据库MongoDB在创建用户时所在的数据库,若选择错误会导致鉴权失败。MongoDB创建用户操作请参见创建用户
    • 连接串模式:通常使用公网类型,可能产生一定的费用。
      参数描述
      数据源类型当前选择的数据源类型为连接串模式
      数据源名称数据源名称必须以字母、数字、下划线(_)组合,且不能以数字和下划线(_)开头。
      数据源描述对数据源进行简单描述,不得超过80个字符。
      适用环境可以选择开发生产环境。
      说明 仅标准模式工作空间会显示该配置。
      访问地址格式为host:port。如果此处您需要同时添加多个地址,请单击添加访问地址进行添加。
      说明 添加的访问地址必须全部为公网地址或全部为私网地址,不可以公网、私网地址混合。
      授权使用数据库输入授权使用的数据库名称。
      数据库名该数据源对应的数据库名称。
      用户名数据库对应的用户名。
      密码数据库对应的密码。
      鉴权数据库MongoDB在创建用户时所在的数据库,若选择错误会导致鉴权失败。MongoDB创建用户操作请参见创建用户
      如果您使用的是连接串模式的数据库,请通过下述操作添加MongoDB数据源:
      1. 选择数据源类型为连接串模式
      2. 新增MongoDB数据源对话框中,配置各项参数,其中访问地址填写您的内网地址。
      3. 添加完成后,无需进行连通性测试,单击完成
      4. 添加自定义资源组,将任务运行在自定义资源组上,详情请参见新增和使用自定义数据集成资源组
      重要
      • MongoDB云数据库仅支持经典网络连通。
      • VPC环境的MongoDB云数据库,添加连接串模式数据源类型并保存。
      • VPC环境不支持测试连通性。
  5. 选择资源组连通性类型为数据集成
  6. 在资源组列表,单击相应资源组后的测试连通性
    数据同步时,一个任务只能使用一种资源组。您需要测试每个资源组的连通性,以保证同步任务使用的数据集成资源组能够与数据源连通,否则将无法正常执行数据同步任务。如果您需要同时测试多种资源组,请选中相应资源组后,单击批量测试连通性。详情请参见配置资源组与网络连通
    说明
    • (推荐)资源组列表默认仅显示独享数据集成资源组,为确保数据同步的稳定性和性能要求,推荐使用独享数据集成资源组。
    • 如果您需要测试公共资源组或自定义资源组的连通性,请在资源组列表右下方,单击更多选项,在警告对话框单击确定,资源组列表会显示可供选择的公共资源组和自定义资源组。
  7. 测试连通性通过后,单击完成

后续步骤

现在,您已经学习了如何配置MongoDB数据源,您可以继续下一个教程。在该教程中,您将学习如何配置MongoDB插件,详情请参见MongoDB ReaderMongoDB Writer