Parameter konfigurasi untuk layanan ClickHouse dari kluster E-MapReduce (EMR) mencakup parameter klien, server, izin pengguna, dan parameter tambahan. Topik ini menjelaskan cara mengonfigurasi klien ClickHouse, server ClickHouse, serta parameter tambahan untuk layanan tersebut.
Informasi latar belakang
| Item | Referensi |
| Klien ClickHouse | client-config |
| Server ClickHouse | server-config |
| Parameter tambahan | server-metrika |
| Izin pengguna | Konfigurasi izin pengguna |
Sebelum memulai
Kluster EMR ClickHouse telah dibuat. Untuk informasi lebih lanjut, lihat Buat Kluster ClickHouse.
Catatan penggunaan
- Jika Anda bisa menambahkan parameter ke tag yandex, tambahkan langsung parameter tersebut. Ini menghilangkan kebutuhan untuk menambahkan parameter di konsol EMR.
- Jika parameter bersarang digunakan, pisahkan lapisan dalam parameter bersarang dengan titik (.).
Sebagai contoh, pada tab server-users, Anda dapat mengonfigurasi parameter bersarang users.aliyun.password untuk pengguna baru bernama aliyun. Nilai parameter ini adalah kata sandi. Anda dapat menentukan kata sandi kustom.
- Saat menambahkan parameter kustom, jangan tentukan nama parameter dan nilai parameter dalam format XML.
client-config
Parameter pada tab client-config digunakan untuk menghasilkan file config.xml yang digunakan oleh klien ClickHouse. Anda dapat pergi ke halaman layanan ClickHouse di konsol EMR, klik client-config pada tab Configure, lalu atur parameter berikut.
| Parameter | Deskripsi |
| user | Nama pengguna yang digunakan untuk masuk ke klien ClickHouse. Nilai default: default. |
| password | Kata sandi yang digunakan untuk masuk ke klien ClickHouse. Secara default, parameter ini dibiarkan kosong. |
| prompt_by_server_display_name.production | Prompt yang disesuaikan untuk klien ClickHouse. Prompt bervariasi berdasarkan nilai parameter display_name pada tab server-config. Jika Anda menetapkan parameter display_name ke default, promptnya adalah nilai parameter prompt_by_server_display_name.default pada tab client-config. Untuk informasi lebih lanjut tentang warna prompt, lihat Color prompts with readline dan tip_colors_and_formatting. |
| prompt_by_server_display_name.default | |
| prompt_by_server_display_name.test |
server-config
Parameter pada tab server-config digunakan untuk menghasilkan file config.xml yang digunakan oleh server ClickHouse. Anda dapat pergi ke halaman layanan ClickHouse di konsol EMR, klik server-config pada tab Configure, lalu atur parameter berikut.
| Parameter | Deskripsi |
| tcp_port | Port TCP yang digunakan untuk berkomunikasi dengan klien ClickHouse. Nilai default: 9000. |
| logger.count | Jumlah maksimum file log ClickHouse yang diarsipkan. Jika jumlah file log yang diarsipkan mencapai nilai parameter ini, ClickHouse akan menghapus file log terlama yang diarsipkan. Nilai default: 10. |
| logger.level | Tingkat log. Nilai default: information. Nilai valid diurutkan berdasarkan tingkat urgensi: none, fatal, critical, error, warning, notice, information, debug, dan trace. Nilai none menunjukkan bahwa pencatatan dinonaktifkan. |
| logger.size | Ukuran maksimum file log. Jika ukuran file log mencapai nilai parameter ini, ClickHouse mengarsipkan dan mengganti nama file log dan membuat file log lainnya. Nilai default: 1000M. |
| distributed_ddl.path | Path yang digunakan oleh ZooKeeper untuk menyimpan antrian query DDL. Nilai default: /clickhouse/task_queue/ddl. Kecuali ditentukan lain, pernyataan CREATE, DROP, ALTER, dan RENAME yang dieksekusi di kluster ClickHouse hanya memengaruhi mesin yang digunakan untuk memproses query. Anda dapat menyetel parameter yang diawali dengan distributed_ddl untuk memungkinkan query dijalankan di kluster ClickHouse. Parameter ini hanya berlaku jika ZooKeeper diaktifkan. |
| default_database | Nama database default. Nilai default: default. |
| uncompressed_cache_size | Ukuran cache blok yang tidak dikompresi jika mesin tabel MergeTree digunakan. Nilai default: 0. Jika menggunakan nilai default, caching dinonaktifkan. |
| timezone | Zona waktu server ClickHouse. Nilai default: Asia/Shanghai. |
| max_session_timeout | Timeout sesi maksimum. Satuan: detik. Nilai default: 3600. |
| default_session_timeout | Timeout sesi default. Satuan: detik. Nilai default: 60. |
| max_concurrent_queries | Jumlah maksimum query yang dapat diproses secara paralel. Nilai default: 0. |
| keep_alive_timeout | Waktu yang diperlukan untuk permintaan dikirim ke layanan ClickHouse sebelum koneksi yang ada ditutup. Satuan: detik. Nilai default: 10. |
| http_port | Port HTTP yang digunakan untuk berkomunikasi dengan server ClickHouse. Nilai default: 8123. Java Database Connectivity (JDBC) dari ClickHouse open source juga menggunakan port ini untuk mengakses kluster ClickHouse. Untuk informasi lebih lanjut, lihat clickhouse-jdbc. |
| listen_host | Alamat IP tempat server ClickHouse mendengarkan. Anda dapat menyetel parameter ini ke alamat IPv4 atau IPv6. Jika Anda menyetel parameter ini ke ::, semua alamat IP diizinkan. Anda dapat mengonfigurasi beberapa alamat IP. Pisahkan beberapa alamat IP dengan koma (,). Contoh: 127.0.0.1,localhost. Nilai default: 0.0.0.0. |
| default_profile | Nama default profil. Nilai default: default. |
| mark_cache_size | Ukuran perkiraan cache yang digunakan oleh indeks mark jika mesin tabel MergeTree digunakan. Nilai default: 5368709120. Satuan: byte. |
| merge_tree.allow_remote_fs_zero_copy_replication | Tetapkan nilai menjadi true. Dengan cara ini, mesin tipe Replicated*MergeTree mereplikasi metadata yang menunjuk ke disk HDFS untuk menghasilkan beberapa replika metadata untuk shard yang sama di kluster ClickHouse. |
| transaction.enable_public_ip | Alamat IP yang digunakan untuk mengidentifikasi transaksi di server ClickHouse. Secara default, alamat IP pribadi digunakan. Tetapkan nilai menjadi true untuk menggunakan alamat IP publik. Namun, Anda harus menetapkan alamat IP publik untuk semua node. |
server-metrika
Parameter pada tab server-metrika digunakan untuk menghasilkan file metrika.xml. Secara default, file metrika.xml dirujuk oleh file config.xml server ClickHouse. Anda dapat pergi ke halaman layanan ClickHouse di konsol EMR, klik server-metrika pada tab Configure, lalu atur parameter berikut.
| Parameter | Deskripsi |
| clickhouse_compression | Pengaturan kompresi data untuk tabel yang menggunakan mesin MergeTree. Untuk informasi lebih lanjut, lihat Server Settings. Secara default, parameter ini dibiarkan kosong. Anda dapat menyetel parameter ini jika ingin mengaktifkan kompresi data. |
| storage_configuration | Informasi disk kustom. |
| zookeeper_servers | Informasi tentang server ZooKeeper yang digunakan untuk mengonfigurasi kluster ClickHouse. Nilai default adalah informasi server ZooKeeper yang dibuat saat Anda membuat kluster ClickHouse. Anda dapat menentukan beberapa server ZooKeeper. Pisahkan informasi server ZooKeeper dengan koma (,), seperti emr-header-1.cluster-12345:2181,emr-worker-1.cluster-12345:2181,emr-worker-2.cluster-12345:2181. |
| quotas_default | Anda dapat mengonfigurasi beberapa kuota untuk menyesuaikan batas sumber daya secara fleksibel. Parameter ini menentukan nilai kuota yang bernama default. Anda dapat menambahkan pengaturan kuota kustom. |
| clickhouse_remote_servers | Informasi tentang shard dan replika yang Anda konfigurasikan untuk kluster ClickHouse. Nilai default adalah topologi yang dihasilkan berdasarkan jumlah shard dan replika yang dikonfigurasikan saat Anda membuat kluster ClickHouse. Penting Ubah nilai parameter ini hanya jika diperlukan. Kami sarankan Anda tidak mengubah jumlah shard, jumlah replika, atau topologi secara manual. Jika tidak, kesalahan mungkin terjadi saat Anda menulis data ke atau meminta data dari kluster ClickHouse. |