本文为您介绍DM Writer支持的数据类型、写入方式、字段映射和数据源等参数及配置示例。
注意 DM Writer仅支持使用新增和使用独享数据集成资源组,不支持使用公共资源组和自定义资源组。
背景信息
DM Writer插件实现了写入数据至DM主库的目的表的功能。在底层实现上,DM Writer通过数据集成框架获取Reader生成的协议数据,通过JDBC连接远程DM数据库,并执行相应的insert into...
的SQL语句,将数据写入DM。
DM Writer面向ETL开发工程师,通过DM Writer从数仓导入数据至DM。同时DM Writer也可以作为数据迁移工具,为数据库管理员等用户提供服务。
目前DM Writer支持数字、字符等大部分通用的关系数据库类型,但也存在部分类型没有支持的情况,请注意检查您的数据类型。
参数说明
参数 | 描述 | 是否必选 | 默认值 |
---|---|---|---|
datasource | 输入DM数据源名称,配置数据源详情请参见配置DM数据源。 | 是 | 无 |
table | 目标表名称,如果表的Schema信息和上述配置username不一致,请使用schema.table 的格式填写table信息。
|
是 | 无 |
column | 所配置的表中需要同步的列名集合。以英文逗号(,)进行分隔。
说明 建议您不要使用默认列情况。
|
是 | 无 |
preSql | 执行数据同步任务之前率先执行的SQL语句,目前只允许执行一条SQL语句,例如清除旧数据。
说明 当有多条SQL语句时,不支持事务。
|
否 | 无 |
postSql | 执行数据同步任务之后执行的SQL语句,目前只允许执行一条SQL语句,例如加上某一个时间戳。
说明 当有多条SQL语句时,不支持事务。
|
否 | 无 |
batchSize | 一次性批量提交的记录数大小,该值可以极大减少数据集成与DM(达梦)的网络交互次数,并提升整体吞吐量。但是该值设置过大可能会造成数据集成运行进程OOM情况。 | 否 | 1024 |
向导开发介绍
打开新建的数据同步节点,即可进行同步任务的配置,详情请参见通过向导模式配置离线同步任务。
您需要在数据同步任务的编辑页面进行以下配置:
- 选择数据源。
配置同步任务的数据来源和数据去向。
参数 描述 数据源 即上述参数说明中的datasource,通常填写您配置的数据源名称。 Schema 选择目标表所属的Schema。 表 即上述参数说明中的table。 导入前准备语句 即上述参数说明中的preSql,输入执行数据同步任务之前率先执行的SQL语句。 导入后完成语句 即上述参数说明中的postSql,输入执行数据同步任务之后执行的SQL语句。 批量条数 即上述参数说明中的batchSize,一次性批量提交的记录数大小。 - 字段映射,即上述参数说明中的column。左侧的源头表字段和右侧的目标表字段为一一对应关系。
参数 描述 同名映射 单击同名映射,可以根据名称建立相应的映射关系,请注意匹配数据类型。 同行映射 单击同行映射,可以在同行建立相应的映射关系,请注意匹配数据类型。 取消映射 单击取消映射,可以取消建立的映射关系。 自动排版 可以根据相应的规律自动排版。 - 通道控制。
参数 描述 任务期望最大并发数 数据同步任务内,可以从源并行读取或并行写入数据存储端的最大线程数。向导模式通过界面化配置并发数,指定任务所使用的并行度。 同步速率 设置同步速率可以保护读取端数据库,以避免抽取速度过大,给源库造成太大的压力。同步速率建议限流,结合源库的配置,请合理配置抽取速率。 错误记录数 错误记录数,表示脏数据的最大容忍条数。 分布式处理能力 数据同步时,可以将任务切片分散到多台执行节点上并发执行,提高同步速率。该模式下,配置较大任务并发数会增加数据存储访问压力,如需使用该功能,请提前评估数据存储的访问负载。该功能仅支持在独享数据集成资源组配置,详情请参见独享数据集成资源组概述和新增和使用独享数据集成资源组。
脚本开发介绍
配置一个写入DM的作业,通过脚本模式开发的详情请参见通过脚本模式配置离线同步任务。
{
"type": "job",
"steps": [
{
"stepType": "oracle",
"parameter": {
"datasource": "aaa",
"column": [
"PROD_ID",
"name"
],
"where": "",
"splitPk": "",
"encoding": "UTF-8",
"table": "PENGXI.SALES"
},
"name": "Reader",
"category": "reader"
},
{
"stepType": "dm",
"parameter": {
"datasource": "dm_datasource",
"table": "table",
"column": [
"id",
"name"
],
"preSql": [
"delete from XXX;"
]
},
"name": "Writer",
"category": "writer"
}
],
"version": "2.0",
"order": {
"hops": [
{
"from": "Reader",
"to": "Writer"
}
]
},
"setting": {
"errorLimit": {
"record": ""
},
"speed": {
"throttle":true,//当throttle值为false时,mbps参数不生效,表示不限流;当throttle值为true时,表示限流。
"concurrent":2, //作业并发数。
"mbps":"12"//限流
}
}
}