AnalyticDB for MySQL memungkinkan Anda mengirimkan aplikasi Spark SQL melalui konsol untuk menganalisis data tanpa perlu menulis paket JAR atau kode Python. Topik ini menjelaskan contoh kode dan jenis-jenis pernyataan yang digunakan untuk menyusun aplikasi Spark SQL di AnalyticDB for MySQL.
Alat pengembangan
Anda dapat menggunakan editor SQL untuk membuat dan menjalankan aplikasi Spark SQL. Untuk informasi lebih lanjut, lihat editor SQL.
Contoh kode
Pada contoh ini, aplikasi Spark SQL disusun untuk membaca data dari Object Storage Service (OSS).
-- Berikut adalah konfigurasi spark.
conf spark.driver.resourceSpec=medium;
conf spark.executor.resourceSpec=medium;
conf spark.app.name=Spark SQL Test;
conf spark.adb.connectors=oss;
-- Tambahkan jar.
add jar oss://example/jars/hive-hcatalog-core-2.3.9.jar;
-- Berikut adalah pernyataan SQL Anda.
CREATE DATABASE IF NOT EXISTS testdb LOCATION 'oss://<bucket_name>/test';
CREATE EXTERNAL TABLE if not EXISTS `testdb`.`catalog_json_test` (
`a` string COMMENT 'from deserializer',
`b` string COMMENT 'from deserializer')
ROW format serde
'org.apache.hive.hcatalog.data.JsonSerDe'
LOCATION
'oss://<bucket_name>/test/catalog_json_test/';
INSERT INTO `testdb`.`catalog_json_test` values('key','value');
SELECT * FROM `testdb`.`catalog_json_test`;Jenis-jenis pernyataan
Pernyataan CONF
Pernyataan CONF digunakan untuk mengonfigurasi mesin Spark. Umumnya, pernyataan CONF ditempatkan sebelum serangkaian pernyataan SQL.
Setiap pernyataan
CONFmenentukan nilai parameter Spark. Setiap pernyataan CONF harus dipisahkan dengan tanda titik koma (;).Kunci dan nilai dalam pernyataan
CONFtidak boleh diapit oleh tanda kutip tunggal (') atau tanda kutip ganda (").Untuk informasi tentang parameter yang didukung oleh pernyataan
CONF, lihat Parameter Konfigurasi Conf.
Pernyataan ADD JAR
Pernyataan ADD JAR digunakan untuk memuat paket JAR yang diperlukan untuk menjalankan aplikasi Spark SQL, seperti paket JAR fungsi yang ditentukan pengguna (UDF) dan paket JAR berbagai konektor sumber data. Paket JAR harus disimpan di OSS. Umumnya, pernyataan ADD JAR ditempatkan sebelum serangkaian pernyataan SQL.
Setiap pernyataan
ADD JARmenentukan jalur OSS dari paket JAR. String dalam jalur tersebut tidak boleh diapit oleh tanda kutip tunggal (') atau tanda kutip ganda ("). Setiap pernyataanADD JARharus dipisahkan dengan tanda titik koma (;).
Pernyataan SQL
Spark SQL mendukung pernyataan DDL, DML, dan DQL. Untuk informasi lebih lanjut, lihat Gunakan Spark SQL untuk Membuat Tabel C-Store.
Contoh: SELECT, INSERT, dan SHOW DATABASE.