Sumber data HBase mendukung pembacaan dari dan penulisan ke HBase. Topik ini menjelaskan kemampuan sinkronisasi sumber data HBase di DataWorks.
Versi yang didukung
Plugin HBase tersedia dalam dua jenis: plugin HBase standar dan plugin HBase{xx}xsql. Plugin HBase{xx}xsql memerlukan HBase dan Phoenix.
Plugin HBase:
Plugin ini mendukung
HBase0.94.x,HBase1.1.x, danHBase2.x. Plugin ini mendukung mode wizard dan mode skrip. Gunakan parameterhbaseVersionuntuk menentukan versi.Jika Anda menggunakan
HBase0.94.x, aturhbaseVersionke094xuntuk plugin Reader maupun Writer."reader": { "hbaseVersion": "094x" }"writer": { "hbaseVersion": "094x" }Jika Anda menggunakan
HBase1.1.xatauHBase2.x, aturhbaseVersionke11xuntuk plugin Reader maupun Writer."reader": { "hbaseVersion": "11x" }"writer": { "hbaseVersion": "11x" }Plugin HBase 1.1.x kompatibel dengan HBase 2.0.
Plugin HBase{xx}xsql:
Plugin HBase20xsql: Mendukung
HBase2.xdanPhoenix5.x. Hanya mendukung mode skrip.Plugin HBase11xsql: Mendukung
HBase1.1.xdanPhoenix5.x. Hanya mendukung mode skrip.Plugin Writer HBase{xx}xsql memungkinkan Anda mengimpor data secara massal ke tabel SQL (Phoenix) di HBase. Phoenix menerapkan encoding data pada rowkey. Menulis data langsung melalui API HBase memerlukan konversi data manual, proses yang kompleks dan rentan kesalahan. Plugin Writer HBase{xx}xsql menyederhanakan proses ini, memberikan cara langsung untuk mengimpor data ke tabel SQL.
CatatanPlugin ini menggunakan driver JDBC Phoenix untuk mengeksekusi pernyataan UPSERT dan menulis data ke tabel secara batch. Karena beroperasi melalui antarmuka tingkat tinggi ini, plugin juga memperbarui tabel indeks terkait secara sinkron.
Batasan
HBase reader | HBase20xsql reader | HBase11xsql writer |
|
|
|
Fitur yang didukung
HBase Reader
HBase Reader mendukung mode normal dan mode multiVersionFixedColumn.
Mode
normal: Memperlakukan tabel HBase sebagai tabel dua dimensi standar dan mengambil versi terbaru dari data.hbase(main):017:0> scan 'users' ROW COLUMN+CELL lisi column=address:city, timestamp=1457101972764, value=beijing lisi column=address:contry, timestamp=1457102773908, value=china lisi column=address:province, timestamp=1457101972736, value=beijing lisi column=info:age, timestamp=1457101972548, value=27 lisi column=info:birthday, timestamp=1457101972604, value=1987-06-17 lisi column=info:company, timestamp=1457101972653, value=baidu xiaoming column=address:city, timestamp=1457082196082, value=hangzhou xiaoming column=address:contry, timestamp=1457082195729, value=china xiaoming column=address:province, timestamp=1457082195773, value=zhejiang xiaoming column=info:age, timestamp=1457082218735, value=29 xiaoming column=info:birthday, timestamp=1457082186830, value=1987-06-17 xiaoming column=info:company, timestamp=1457082189826, value=alibaba 2 row(s) in 0.0580 secondsTabel berikut menampilkan outputnya.
rowKey
address:city
address:contry
address:province
info:age
info:birthday
info:company
lisi
beijing
china
beijing
27
1987-06-17
baidu
xiaoming
hangzhou
china
zhejiang
29
1987-06-17
alibaba
Mode
multiVersionFixedColumn: Memperlakukan tabel HBase sebagai tabel vertikal. Setiap catatan terdiri dari empat kolom:rowKey,family:qualifier,timestamp, danvalue. Anda harus menentukan kolom yang akan dibaca. Mode ini memperlakukan setiap nilai sel sebagai catatan terpisah. Jika sebuah sel memiliki beberapa versi, mode ini menghasilkan catatan terpisah untuk setiap versi.hbase(main):018:0> scan 'users',{VERSIONS=>5} ROW COLUMN+CELL lisi column=address:city, timestamp=1457101972764, value=beijing lisi column=address:contry, timestamp=1457102773908, value=china lisi column=address:province, timestamp=1457101972736, value=beijing lisi column=info:age, timestamp=1457101972548, value=27 lisi column=info:birthday, timestamp=1457101972604, value=1987-06-17 lisi column=info:company, timestamp=1457101972653, value=baidu xiaoming column=address:city, timestamp=1457082196082, value=hangzhou xiaoming column=address:contry, timestamp=1457082195729, value=china xiaoming column=address:province, timestamp=1457082195773, value=zhejiang xiaoming column=info:age, timestamp=1457082218735, value=29 xiaoming column=info:age, timestamp=1457082178630, value=24 xiaoming column=info:birthday, timestamp=1457082186830, value=1987-06-17 xiaoming column=info:company, timestamp=1457082189826, value=alibaba 2 row(s) in 0.0260 secondsTabel berikut menampilkan outputnya.
rowKey
column:qualifier
timestamp
Value
lisi
address:city
1457101972764
beijing
lisi
address:contry
1457102773908
china
lisi
address:province
1457101972736
beijing
lisi
info:age
1457101972548
27
lisi
info:birthday
1457101972604
1987-06-17
lisi
info:company
1457101972653
baidu
xiaoming
address:city
1457082196082
hangzhou
xiaoming
address:contry
1457082195729
china
xiaoming
address:province
1457082195773
zhejiang
xiaoming
info:age
1457082218735
29
xiaoming
info:age
1457082178630
24
xiaoming
info:birthday
1457082186830
1987-06-17
xiaoming
info:company
1457082189826
alibaba
HBase Writer
HBase Writer dapat menghasilkan
rowKeydengan menggabungkan beberapa kolom dari sumber.HBase Writer dapat mengatur
version(timestamp) data dengan cara berikut:Menggunakan waktu saat ini.
Menggunakan nilai dari kolom sumber.
Menggunakan waktu yang ditentukan pengguna.
Tipe bidang yang didukung
Baca batch
Tabel berikut mencantumkan pemetaan tipe data untuk HBase Reader.
Tipe
Jenis Kolom Data Integration
Tipe data database
Integer
long
short, int, dan long
Floating-point
double
float dan double
String
string
binary_string dan string
Date and Time
date
date
Byte
bytes
bytes
Boolean
boolean
boolean
HBase20xsql Reader mendukung sebagian besar, tetapi tidak semua, tipe data Phoenix. Pastikan tipe data Anda didukung sebelum digunakan.
Tabel berikut mencantumkan pemetaan tipe yang digunakan oleh HBase20xsql Reader untuk tipe data Phoenix.
Tipe internal DataX
Tipe data Phoenix
long
INTEGER, TINYINT, SMALLINT, dan BIGINT
double
FLOAT, DECIMAL, dan DOUBLE
string
CHAR dan VARCHAR
date
DATE, TIME, dan TIMESTAMP
bytes
BINARY dan VARBINARY
boolean
BOOLEAN
Tulis batch
Tabel berikut mencantumkan pemetaan tipe data untuk HBase Writer.
Pastikan konfigurasi
columnsesuai dengan tipe kolom yang sesuai di tabel HBase.Hanya tipe data yang tercantum dalam tabel berikut yang didukung.
Tipe | Tipe data database |
Integer | INT, LONG, dan SHORT |
Floating-point | FLOAT dan DOUBLE |
Boolean | BOOLEAN |
String | STRING |
Pertimbangan
Jika Anda menerima pesan error "tried to access method com.google.common.base.Stopwatch" saat menguji konektivitas, tambahkan properti hbaseVersion ke konfigurasi Data Source dan tentukan versi HBase.
Tambahkan sumber data
Sebelum mengembangkan tugas sinkronisasi di DataWorks, Anda harus menambahkan sumber data yang diperlukan ke DataWorks dengan mengikuti petunjuk di Manajemen Sumber Data. Anda dapat melihat deskripsi parameter di Konsol DataWorks untuk memahami arti parameter saat menambahkan sumber data.
Tugas sinkronisasi data
Untuk informasi tentang titik masuk dan prosedur konfigurasi tugas sinkronisasi, lihat panduan konfigurasi berikut.
Tugas sinkronisasi offline single-table
Untuk petunjuk, lihat Konfigurasikan tugas di Antarmuka tanpa kode dan Konfigurasikan tugas di editor kode.
Secara default, Mode Wizard tidak menampilkan bagian Pemetaan Bidang karena HBase merupakan sumber data tanpa skema. Anda harus mengonfigurasi pemetaan bidang secara manual:
Saat HBase adalah sumber data, konfigurasikan Source Field dalam format berikut:
data_type|column_family:column_name.Saat HBase adalah tujuan data, konfigurasikan Destination Field dan rowkey. Untuk Destination Field, gunakan format
source_field_index|data_type|column_family:column_name. Untuk rowkey, gunakan formatsource_primary_key_index|data_type.
CatatanSetiap bidang harus berada di baris terpisah.
Untuk daftar lengkap parameter dan contoh skrip dalam Mode Skrip, lihat Lampiran: Demo skrip dan parameter.
FAQ
Q: Berapa pengaturan konkurensi yang disarankan? Apakah meningkatkannya membantu jika impor lambat?
A: Ukuran Heap JVM default untuk proses Impor Data adalah 2 GB. Konkurensi (jumlah saluran) diimplementasikan menggunakan multi-threading. Namun, membuat terlalu banyak thread tidak selalu meningkatkan kecepatan impor dan dapat menurunkan performa akibat Garbage Collection (GC) yang sering terjadi. Sebagai praktik terbaik, kami menyarankan mengatur konkurensi (jumlah saluran) antara 5 hingga 10.
Q: Berapa pengaturan
batchSizeyang disarankan?A: Nilai defaultnya adalah 256, tetapi Anda harus menghitung
batchSizeoptimal berdasarkan ukuran rata-rata baris Anda. Sebagai praktik terbaik, targetkan ukuran data total 2 MB hingga 4 MB per batch. Bagi ukuran target ini dengan ukuran rata-rata baris Anda untuk menentukanbatchSizeyang sesuai.
Lampiran: Demo skrip dan parameter
Konfigurasikan tugas sinkronisasi batch menggunakan editor kode
Jika Anda ingin mengonfigurasi tugas sinkronisasi batch menggunakan editor kode, Anda harus mengonfigurasi parameter terkait dalam skrip berdasarkan persyaratan format skrip terpadu. Untuk informasi lebih lanjut, lihat Konfigurasikan tugas di editor kode. Informasi berikut menjelaskan parameter yang harus Anda konfigurasi untuk sumber data saat mengonfigurasi tugas sinkronisasi batch menggunakan editor kode.
Demo skrip HBase Reader
{
"type":"job",
"version":"2.0",// Nomor versi.
"steps":[
{
"stepType":"hbase",// Nama plugin.
"parameter":{
"mode":"normal",// Mode untuk membaca data dari HBase. Nilai yang valid: normal dan multiVersionFixedColumn.
"scanCacheSize":"256",// Jumlah baris yang dibaca klien dari server per RPC.
"scanBatchSize":"100",// Jumlah kolom yang dibaca klien dari server per RPC.
"hbaseVersion":"094x/11x",// Versi HBase.
"column":[// Kolom yang akan dibaca.
{
"name":"rowkey",// Nama kolom.
"type":"string"// Tipe data.
},
{
"name":"columnFamilyName1:columnName1",
"type":"string"
},
{
"name":"columnFamilyName2:columnName2",
"format":"yyyy-MM-dd",
"type":"date"
},
{
"name":"columnFamilyName3:columnName3",
"type":"long"
}
],
"range":{// Rentang rowkey untuk HBase Reader.
"endRowkey":"",// Rowkey akhir.
"isBinaryRowkey":true,// Menentukan cara mengonversi startRowkey dan endRowkey ke array byte. Nilai default adalah false.
"startRowkey":""// Rowkey awal.
},
"maxVersion":"",// Jumlah versi yang dibaca dalam mode multi-versi.
"encoding":"UTF-8",// Format encoding.
"table":"",// Nama tabel.
"hbaseConfig":{// Konfigurasi koneksi untuk kluster HBase, dalam format JSON.
"hbase.zookeeper.quorum":"hostname",
"hbase.rootdir":"hdfs://ip:port/database",
"hbase.cluster.distributed":"true"
}
},
"name":"Reader",
"category":"reader"
},
{
"stepType":"stream",
"parameter":{},
"name":"Writer",
"category":"writer"
}
],
"setting":{
"errorLimit":{
"record":"0"// Jumlah maksimum catatan error yang diizinkan.
},
"speed":{
"throttle":true,// Mengaktifkan Pembatasan kecepatan. Jika true, Pembatasan kecepatan diaktifkan berdasarkan nilai mbps. Jika false, parameter mbps diabaikan.
"concurrent":1,// Jumlah tugas konkuren untuk pekerjaan.
"mbps":"12"// Laju pembatasan. Dalam contoh ini, 1 mbps sama dengan 1 MB/s.
}
},
"order":{
"hops":[
{
"from":"Reader",
"to":"Writer"
}
]
}
}Parameter HBase Reader
Parameter | Deskripsi | Wajib | Default |
haveKerberos | Menentukan apakah kluster HBase memerlukan autentikasi Kerberos. Jika diatur ke Catatan
| Tidak | false |
hbaseConfig | Konfigurasi koneksi untuk kluster HBase, dalam format JSON. Properti hbase.zookeeper.quorum, yang menentukan alamat ZooKeeper (ZK) kluster HBase, wajib diisi. Anda dapat menambahkan konfigurasi klien HBase lainnya, seperti pengaturan cache dan batch, untuk mengoptimalkan interaksi dengan server. Catatan Jika Anda terhubung ke database ApsaraDB for HBase, gunakan alamat privatnya. | Ya | Tidak ada |
mode | Mode untuk membaca data dari HBase. Nilai yang valid: normal dan multiVersionFixedColumn. | Ya | Tidak ada |
table | Nama tabel HBase yang akan dibaca. Parameter ini case-sensitive. | Ya | Tidak ada |
encoding | Format encoding yang digunakan untuk mengonversi array biner HBase byte[] menjadi string. Nilai yang valid: UTF-8 dan GBK. | Tidak | UTF-8 |
column | Kolom yang akan dibaca dari HBase. Parameter ini wajib diisi baik dalam mode normal maupun multiVersionFixedColumn.
| Ya | Tidak ada |
maxVersion | Jumlah versi yang dibaca HBase Reader dalam mode multi-versi. Atur ke -1 untuk membaca semua versi, atau ke bilangan bulat lebih besar dari 1. | Wajib dalam mode | Tidak ada |
range | Menentukan rentang rowkey untuk HBase Reader.
| Tidak | Tidak ada |
scanCacheSize | Jumlah baris yang diambil HBase Reader dari server per RPC. | Tidak | 256 |
scanBatchSize | Jumlah kolom yang diambil HBase Reader dari server per RPC. Nilai -1 menunjukkan bahwa semua kolom dikembalikan. Catatan Untuk menghindari potensi masalah kualitas data, atur scanBatchSize ke nilai yang lebih besar dari jumlah kolom aktual. | Tidak | 100 |
Demo skrip HBase Writer
{
"type":"job",
"version":"2.0",// Nomor versi.
"steps":[
{
"stepType":"stream",
"parameter":{},
"name":"Reader",
"category":"reader"
},
{
"stepType":"hbase",// Nama plugin.
"parameter":{
"mode":"normal",// Mode untuk menulis data ke HBase.
"walFlag":"false",// Menentukan apakah akan menulis ke Write-Ahead Log (WAL). Nilai false menonaktifkannya.
"hbaseVersion":"094x",// Versi HBase.
"rowkeyColumn":[// Kolom yang digunakan untuk rowkey.
{
"index":"0",// Nomor seri.
"type":"string"// Tipe data.
},
{
"index":"-1",
"type":"string",
"value":"_"
}
],
"nullMode":"skip",// Menentukan cara menangani nilai null.
"column":[// Kolom HBase yang akan ditulis.
{
"name":"columnFamilyName1:columnName1",// Nama kolom.
"index":"0",// Nomor indeks.
"type":"string"// Tipe data.
},
{
"name":"columnFamilyName2:columnName2",
"index":"1",
"type":"string"
},
{
"name":"columnFamilyName3:columnName3",
"index":"2",
"type":"string"
}
],
"encoding":"utf-8",// Format encoding.
"table":"",// Nama tabel.
"hbaseConfig":{// Konfigurasi koneksi untuk kluster HBase, dalam format JSON.
"hbase.zookeeper.quorum":"hostname",
"hbase.rootdir":"hdfs://ip:port/database",
"hbase.cluster.distributed":"true"
}
},
"name":"Writer",
"category":"writer"
}
],
"setting":{
"errorLimit":{
"record":"0"// Jumlah maksimum catatan error yang diizinkan.
},
"speed":{
"throttle":true,// Mengaktifkan Pembatasan kecepatan. Jika true, Pembatasan kecepatan diaktifkan berdasarkan nilai mbps. Jika false, parameter mbps diabaikan.
"concurrent":1, // Jumlah tugas konkuren untuk pekerjaan.
"mbps":"12"// Laju pembatasan.
}
},
"order":{
"hops":[
{
"from":"Reader",
"to":"Writer"
}
]
}
}Parameter HBase Writer
Parameter | Deskripsi | Wajib | Default |
haveKerberos | Menentukan apakah kluster HBase memerlukan autentikasi Kerberos. Jika diatur ke Catatan
| Tidak | false |
hbaseConfig | Konfigurasi koneksi untuk kluster HBase, dalam format JSON. Properti hbase.zookeeper.quorum, yang menentukan alamat ZooKeeper (ZK) kluster HBase, wajib diisi. Anda dapat menambahkan konfigurasi klien HBase lainnya, seperti pengaturan cache dan batch, untuk mengoptimalkan interaksi dengan server. Catatan Jika Anda terhubung ke database ApsaraDB for HBase, gunakan alamat privatnya. | Ya | Tidak ada |
mode | Mode untuk menulis data ke HBase. Saat ini, hanya mode normal yang didukung. | Ya | Tidak ada |
table | Nama tabel HBase target. Parameter ini case-sensitive. | Ya | Tidak ada |
encoding | Format encoding yang digunakan untuk mengonversi STRING menjadi array HBase byte[]. Nilai yang valid: UTF-8 dan GBK. | Tidak | UTF-8 |
column | Kolom HBase yang akan ditulis:
| Ya | Tidak ada |
rowkeyColumn | Menentukan kolom yang digunakan untuk membuat rowkey saat menulis data ke HBase:
Konfigurasinya sebagai berikut: | Ya | Tidak ada |
versionColumn | Menentukan Timestamp untuk data yang ditulis ke HBase. Anda dapat menggunakan waktu sistem saat ini, nilai dari kolom sumber, atau nilai tetap. Jika parameter ini tidak dikonfigurasi, waktu saat ini digunakan secara default.
Konfigurasinya sebagai berikut:
| Tidak | Tidak ada |
nullMode | Menentukan cara menangani nilai null dari data sumber:
| Tidak | skip |
walFlag | Saat klien mengirim operasi Put atau Delete, data pertama-tama ditulis ke Write-Ahead Log (WAL) sebelum disimpan di MemStore. Proses ini memastikan ketahanan data. Mengatur parameter ini ke | Tidak | false |
writeBufferSize | Ukuran buffer tulis klien HBase dalam byte. Buffer ini bekerja dengan pengaturan
| Tidak | 8 MB |
fileSystemUsername | Jika tugas sinkronisasi data gagal karena masalah izin Ranger, beralihlah ke Mode Skrip dan atur parameter ini ke username yang memiliki izin akses HBase yang diperlukan. DataWorks kemudian menggunakan username ini untuk koneksi. | Tidak | Tidak ada |
Demo skrip HBase20xsql Reader
{
"type":"job",
"version":"2.0",// Nomor versi.
"steps":[
{
"stepType":"hbase20xsql",// Nama plugin.
"parameter":{
"queryServerAddress": "http://127.0.0.1:8765", // Alamat Phoenix QueryServer.
"serialization": "PROTOBUF", // Format serialisasi QueryServer.
"table": "TEST", // Tabel yang akan dibaca.
"column": ["ID", "NAME"], // Kolom yang akan dibaca.
"splitKey": "ID" // Kolom pemisah, yang harus merupakan kunci primer tabel.
},
"name":"Reader",
"category":"reader"
},
{
"stepType":"stream",
"parameter":{},
"name":"Writer",
"category":"writer"
}
],
"setting":{
"errorLimit":{
"record":"0"// Jumlah maksimum catatan error yang diizinkan.
},
"speed":{
"throttle":true,// Mengaktifkan Pembatasan kecepatan. Jika true, Pembatasan kecepatan diaktifkan berdasarkan nilai mbps. Jika false, parameter mbps diabaikan.
"concurrent":1,// Jumlah tugas konkuren untuk pekerjaan.
"mbps":"12"// Laju pembatasan. Dalam contoh ini, 1 mbps sama dengan 1 MB/s.
}
},
"order":{
"hops":[
{
"from":"Reader",
"to":"Writer"
}
]
}
}Parameter HBase20xsql Reader
Parameter | Deskripsi | Wajib | Default |
queryServerAddress | HBase20xsql Reader menggunakan klien ringan Phoenix untuk terhubung ke Phoenix QueryServer. Tentukan alamat QueryServer di sini. Untuk pengguna ApsaraDB for HBase edisi enhanced (Lindorm), Anda dapat meneruskan parameter | Ya | Tidak ada |
serialization | Protokol serialisasi yang digunakan oleh QueryServer. | Tidak | PROTOBUF |
table | Nama tabel yang akan dibaca. Parameter ini case-sensitive. | Ya | Tidak ada |
schema | Skema yang berisi tabel. | Tidak | Tidak ada |
column | Array JSON yang berisi nama kolom yang akan disinkronkan. Jika dibiarkan kosong, semua kolom akan dibaca. | Tidak | Semua kolom |
splitKey | Menentukan kolom yang digunakan untuk sharding data. Menyediakan splitKey memungkinkan sinkronisasi data paralel, yang meningkatkan performa. Tersedia dua metode pemisahan. Jika splitPoint kosong, data secara otomatis dipisah berdasarkan Metode 1:
| Ya | Tidak ada |
splitPoints | Memisahkan kolom berdasarkan nilai minimum dan maksimumnya dapat menyebabkan hotspot data. Oleh karena itu, kami menyarankan menetapkan titik pemisah berdasarkan startkey dan endkey dari regions. Pendekatan ini menyelaraskan setiap kueri dengan satu region, mencegah hotspot. | Tidak | Tidak ada |
where | Kondisi filter. Anda dapat menambahkan filter ke kueri tabel. HBase20xsql Reader membuat kueri SQL berdasarkan kondisi column, table, dan where yang ditentukan, lalu mengekstrak data berdasarkan kueri tersebut. | Tidak | Tidak ada |
querySql | Dalam beberapa kasus penggunaan, parameter where mungkin tidak cukup untuk menggambarkan kondisi filter yang diinginkan. Anda dapat menggunakan parameter ini untuk mendefinisikan kueri SQL filter kustom. Saat | Tidak | Tidak ada |
Demo skrip HBase11xsql Writer
{
"type": "job",
"version": "1.0",
"configuration": {
"setting": {
"errorLimit": {
"record": "0"
},
"speed": {
"throttle":true,// Mengaktifkan Pembatasan kecepatan. Jika true, Pembatasan kecepatan diaktifkan berdasarkan nilai mbps. Jika false, parameter mbps diabaikan.
"concurrent":1, // Jumlah tugas konkuren untuk pekerjaan.
"mbps":"1"// Laju pembatasan. Dalam contoh ini, 1 mbps sama dengan 1 MB/s.
}
},
"reader": {
"plugin": "odps",
"parameter": {
"datasource": "",
"table": "",
"column": [],
"partition": ""
}
},
"plugin": "hbase11xsql",
"parameter": {
"table": "Nama tabel HBase target, yang case-sensitive.",
"hbaseConfig": {
"hbase.zookeeper.quorum": "Alamat server ZooKeeper kluster HBase target.",
"zookeeper.znode.parent": "znode kluster HBase target."
},
"column": [
"columnName"
],
"batchSize": 256,
"nullMode": "skip"
}
}
}Parameter HBase11xsql Writer
Parameter | Deskripsi | Wajib | Default |
plugin | Nama plugin. Harus | Ya | Tidak ada |
table | Nama tabel Phoenix target untuk impor data. Parameter ini case-sensitive. Nama tabel Phoenix biasanya dalam huruf kapital. | Ya | Tidak ada |
column | Nama kolom. Parameter ini case-sensitive. Nama kolom Phoenix biasanya dalam huruf kapital. Catatan
| Ya | Tidak ada |
hbaseConfig | Alamat kluster HBase. Quorum ZooKeeper wajib diisi. Format: Catatan
| Ya | Tidak ada |
batchSize | Jumlah maksimum baris dalam operasi tulis batch. | Tidak | 256 |
nullMode | Menentukan cara menangani nilai null dari data sumber:
| Tidak | skip |