全部产品
Search
文档中心

ApsaraDB for SelectDB:Gunakan DataWorks untuk mengimpor data

更新时间:Jul 30, 2025

ApsaraDB for SelectDB memungkinkan Anda menggunakan fitur Integrasi Data dari DataWorks untuk mengimpor data dari tabel dengan SelectDB Writer. Topik ini menjelaskan cara menggunakan DataWorks untuk menyinkronkan data dari sumber data MySQL ke instans ApsaraDB for SelectDB.

Catatan penggunaan

  • Jika Anda menggunakan fitur Integrasi Data dari DataWorks untuk mengimpor data ke instans ApsaraDB for SelectDB, data harus ditulis secara offline.

  • Anda tidak dapat menulis bidang tipe data BITMAP, HyperLogLog (HLL), atau QUANTILE_STATE.

Mengembangkan tugas sinkronisasi data

Tambahkan sumber data

Sebelum mengonfigurasi tugas sinkronisasi data, tambahkan sumber data MySQL dan sumber data ApsaraDB for SelectDB ke DataWorks.

  1. Untuk informasi lebih lanjut tentang cara menambahkan sumber data MySQL, lihat Sumber Data MySQL.

  2. Untuk informasi lebih lanjut tentang cara menambahkan sumber data ApsaraDB for SelectDB, lihat Tambahkan dan Kelola Sumber Data. Tabel berikut menjelaskan parameter yang digunakan untuk menambahkan sumber data ApsaraDB for SelectDB.

    Parameter

    Deskripsi

    Data Source Name

    Nama sumber data.

    JDBC URL

    Java Database Connectivity (JDBC) URL dalam format jdbc:mysql://<ip>:<port>/<dbname>.

    Untuk mendapatkan titik akhir virtual private cloud (VPC) atau titik akhir publik dan port MySQL dari instans ApsaraDB for SelectDB, lakukan operasi berikut: Masuk ke ApsaraDB for SelectDB dan buka halaman Instance Details dari instans yang ingin Anda lihat informasinya. Di bagian Network Information tab Informasi Dasar, lihat nilai parameter VPC Endpoint atau Public Endpoint dan parameter MySQL Port.

    Contoh: jdbc:mysql://selectdb-cn-4xl3jv1****.selectdbfe.rds.aliyuncs.com:9030/test_db

    Catatan

    Jika instans MySQL dan instans ApsaraDB for SelectDB berada di VPC yang sama, gunakan titik akhir VPC untuk parameter ini. Jika instans MySQL dan instans ApsaraDB for SelectDB berada di VPC yang berbeda, gunakan titik akhir publik untuk parameter ini.

    HTTP address

    Alamat IP dan nomor port yang digunakan untuk mengakses instans ApsaraDB for SelectDB melalui HTTP. Nilainya dalam format <ip>:<port>.

    Untuk mendapatkan titik akhir VPC atau titik akhir publik dan port HTTP dari instans ApsaraDB for SelectDB, lakukan operasi berikut: Masuk ke ApsaraDB for SelectDB dan buka halaman Instance Details dari instans yang ingin Anda lihat informasinya. Di bagian Network Information tab Informasi Dasar, lihat nilai parameter VPC Endpoint atau Public Endpoint dan parameter HTTP Port.

    Contoh: selectdb-cn-4xl3jv1****.selectdbfe.rds.aliyuncs.com:8080

    Catatan

    Jika instans MySQL dan instans ApsaraDB for SelectDB berada di VPC yang sama, gunakan titik akhir VPC untuk parameter ini. Jika instans MySQL dan instans ApsaraDB for SelectDB berada di VPC yang berbeda, gunakan titik akhir publik untuk parameter ini.

    Username

    Nama pengguna akun pemilik instans ApsaraDB for SelectDB.

    Password

    Kata sandi akun pemilik instans ApsaraDB for SelectDB.

    Penting

    Untuk memastikan bahwa sumber data dapat ditambahkan, tambahkan alamat IP dari kelompok sumber daya di DataWorks ke daftar putih alamat IP dari sumber data seperti ApsaraDB for SelectDB. Untuk informasi lebih lanjut, lihat Konfigurasikan Daftar Putih Alamat IP. Saat mengonfigurasi daftar putih alamat IP, tambahkan alamat IP dari jenis kelompok sumber daya yang berbeda ke daftar putih alamat IP yang sesuai. Misalnya, alamat IP dari grup sumber daya eksklusif untuk Integrasi Data dan grup sumber daya bersama untuk Integrasi Data harus ditambahkan ke daftar putih alamat IP yang berbeda.

Konfigurasikan tugas sinkronisasi batch untuk menyinkronkan data dari satu tabel

Anda dapat mengonfigurasi tugas sinkronisasi batch menggunakan antarmuka tanpa kode atau editor kode. Untuk informasi lebih lanjut, lihat topik-topik berikut:

Kode contoh dan parameter

Konfigurasikan tugas sinkronisasi batch menggunakan editor kode

Jika Anda mengonfigurasi tugas sinkronisasi batch menggunakan editor kode, tulis skrip berdasarkan persyaratan format di editor kode. Untuk informasi lebih lanjut, lihat Konfigurasikan Tugas Sinkronisasi Batch Menggunakan Editor Kode.

Kode untuk MySQL Reader dan SelectDB Writer

{
	"type":"job",
	"version":"2.0",
	"steps":[
		{
			"stepType":"mysql",
			"parameter":{
				"column":[
          "<id>",
          "<table_id>",
          "<table_no>",
          "<table_name>",
          "<table_status>"
				],
				"connection":[
					{
						"datasource":"<mysql_datasource>",
						"table":[
							"<mysql_table_name>"
						]
					}
				],
				"where":"",
				"splitPk":"",
				"encoding":"UTF-8"
			},
			"name":"Reader",
			"category":"reader"
		},
		{
			"stepType":"selectdb",
			"parameter":{
        "postSql":[
        ],
        "preSql":[
        ],
        "username": "<selectdb_username>",
        "password": "<selectdb_password>",
        "loadUrl":[
          "<ip:port>"
        ],
        "column":[
          "<id>",
          "<table_id>",
          "<table_no>",
          "<table_name>",
          "<table_status>"
				],
        "connection":[
					{
						"datasource":"<selectdb_datasource>",
						"table":[
							"<selectdb_table_name>"
						]
					}
				],
        "maxBatchRows":1000000,
        "loadProps":{
          "format":"csv",
          "column_separator": "\\x01",
          "line_delimiter": "\\x02"
        }
      },
			"name":"Writer",
			"category":"writer"
		}
	],
	"setting":{
		"errorLimit":{
			"record":"0"
		},
		"speed":{
			"throttle":false,
			"concurrent":1
		}
	},
	"order":{
		"hops":[
			{
				"from":"Reader",
				"to":"Writer"
			}
		]
	}
}

Parameter

Parameter

Deskripsi

datasource

Nama sumber data. Parameter ini wajib. Anda dapat menambahkan sumber data saat mengonfigurasi tugas sinkronisasi batch menggunakan editor kode. Nilai parameter ini harus sama dengan nama sumber data yang akan ditambahkan.

table

Nama tabel dari mana data akan disinkronkan. Parameter ini wajib.

column

Nama kolom tempat Anda ingin menulis data di tabel tujuan. Pisahkan nama kolom dengan koma (,). Parameter ini wajib. Contoh: "column":["id","name","age"]. Jika Anda ingin menulis data ke semua kolom di tabel tujuan, atur parameter ini ke asterisk (*). Contoh: "column":["*"].

loadUrl

URL yang digunakan untuk mengakses instans ApsaraDB for SelectDB. Parameter ini wajib. Format: ip:port. ip menunjukkan VPC endpoint dari instans ApsaraDB for SelectDB, dan port menunjukkan HTTP port dari instans ApsaraDB for SelectDB. Contoh: selectdb-cn-4xl3jv1****.selectdbfe.rds.aliyuncs.com:8080.

username

Nama pengguna yang digunakan untuk mengakses database ApsaraDB for SelectDB. Parameter ini wajib.

password

Kata sandi yang digunakan untuk mengakses database ApsaraDB for SelectDB. Parameter ini wajib.

preSql

Pernyataan SQL yang ingin Anda eksekusi sebelum tugas sinkronisasi batch dijalankan. Misalnya, Anda dapat mengatur parameter ini ke pernyataan SQL yang digunakan untuk menghapus data lama. Anda hanya dapat mengeksekusi satu pernyataan SQL di antarmuka tanpa kode dan beberapa pernyataan SQL di editor kode.

postSql

Pernyataan SQL yang ingin Anda eksekusi setelah tugas sinkronisasi dijalankan. Misalnya, Anda dapat mengatur parameter ini ke pernyataan SQL yang digunakan untuk menambahkan cap waktu. Anda hanya dapat mengeksekusi satu pernyataan SQL di antarmuka tanpa kode dan beberapa pernyataan SQL di editor kode.

maxBatchRows

Jumlah maksimum baris yang dapat Anda tulis ke tabel tujuan dalam satu waktu. Nilai default: 500000.

loadProps

Parameter permintaan COPY INTO, yang digunakan untuk menentukan format data yang akan diimpor. Nilai default: json. Jika parameter loadProps dibiarkan kosong atau diatur ke {}, format JSON digunakan secara default. Jika format JSON digunakan, Anda hanya dapat mengonfigurasi pengaturan berikut untuk instans ApsaraDB for SelectDB. Parameter strip_outer_array diatur ke true.

"loadProps": {
   "format": "json",
   "strip_outer_array":true
}

Jika Anda ingin mengimpor data dalam format CSV, Anda dapat mengonfigurasi pengaturan berikut untuk menentukan format CSV dan mengonfigurasi pemisah baris dan kolom. Jika Anda tidak menentukan pemisah baris dan kolom, data yang diimpor akan dikonversi menjadi string secara default. \t digunakan sebagai pemisah kolom dan \n digunakan sebagai pemisah baris untuk membentuk file CSV untuk mengimpor data ke instans ApsaraDB for SelectDB.

"loadProps": {
   "format":"csv",
   "column_separator": "\\x01",
   "line_delimiter": "\\x02"
}

Tipe data yang didukung

Tabel berikut menjelaskan tipe data yang didukung oleh ApsaraDB for SelectDB.

Tipe data

Penulisan data offline SelectDB Writer

INT

Didukung

BIGINT

Didukung

LARGEINT

Didukung

SMALLINT

Didukung

TINYINT

Didukung

BOOLEAN

Didukung

DECIMAL

Didukung

DOUBLE

Didukung

FLOAT

Didukung

CHAR

Didukung

VARCHAR

Didukung

STRING

Didukung

DATE

Didukung

DATEV2

Didukung

DATETIME

Didukung

DATETIMEV2

Didukung

ARRAY

Didukung

JSONB

Didukung

BITMAP

Tidak didukung

HLL

Tidak didukung

QUANTILE_STATE

Tidak didukung

Referensi

Apa itu DataWorks?