全部产品
Search
文档中心

DataWorks:Buat tabel EMR

更新时间:Jul 09, 2025

Topik ini menjelaskan cara membuat tabel E-MapReduce (EMR).

Informasi latar belakang

Setelah membuat sumber daya komputasi EMR di DataStudio (versi lama), layanan Data Map dari DataWorks akan membuat crawler untuk mengumpulkan metadata kluster. Jika tidak ada database yang tersedia setelah menambahkan sumber daya komputasi EMR, buka halaman DataMap dan gunakan crawler untuk mengumpulkan metadata kluster. Untuk informasi lebih lanjut, lihat Kumpulkan metadata dari sumber data EMR.

Prosedur

  1. Buka halaman DataStudio.

    Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih Data Development and O&M > Data Development. Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.

  2. Di halaman DataStudio, arahkan pointer ke ikon 新建 dan pilih Create Table > EMR > Table.

    Anda juga dapat menemukan alur kerja tempat Anda ingin membuat tabel EMR, klik kanan EMR, dan pilih Create Table.

  3. Di kotak dialog Create Table, konfigurasikan parameter.

    新建emr表

  4. Klik Create. Tab konfigurasi tabel akan muncul.

  5. Di bagian Basic attributes, konfigurasikan parameter. Tabel berikut menjelaskan parameter tersebut.

    基本属性

    Parameter

    Deskripsi

    Level 1 theme

    Nama folder tingkat-1 tempat tabel berada.

    Catatan

    Folder tingkat-1 dan tingkat-2 menunjukkan lokasi tabel di DataWorks untuk membantu Anda dengan mudah mengelola tabel.

    Level 2 theme

    Nama folder tingkat-2 tempat tabel berada.

    Create a theme

    Klik Create a theme untuk pergi ke tab Folder Management. Di tab Manajemen Folder, Anda dapat membuat folder tingkat-1 dan tingkat-2.

    Refresh

    Setelah Anda membuat folder, klik Refresh.

    Description

    Deskripsi tabel.

  6. Di bagian Physical model design, konfigurasikan parameter. Tabel berikut menjelaskan parameter tersebut.

    物理模型

    Parameter

    Deskripsi

    Layer

    Pilih level dan kategori bisnis dari daftar drop-down berdasarkan kebutuhan bisnis Anda. Untuk membuat level dan kategori bisnis, klik Create Level untuk pergi ke tab Level Management dan buat level serta kategori bisnis. Anda hanya dapat melakukan operasi ini jika Anda adalah administrator ruang kerja. Setelah Anda membuat level dan kategori bisnis, klik Refresh.

    Physical classification

    Partition type

    Nilai valid: Partition table dan Non-partitioned table.

    Table type

    Nilai valid: Internal tables dan External tables.

    Select the storage format

    Pilih format penyimpanan untuk file dalam tabel berdasarkan kebutuhan bisnis Anda.

  7. Di bagian Table structure design, konfigurasikan parameter. Tabel berikut menjelaskan parameter tersebut.

    表结构

    Parameter

    Deskripsi

    Add fields

    Untuk menambahkan bidang, klik Add fields, konfigurasikan informasi bidang, dan kemudian klik Save.

    Move up

    Anda dapat mengklik tombol untuk menyesuaikan urutan bidang tabel. Jika Anda ingin menyesuaikan urutan bidang dalam tabel yang ada, Anda harus menghapus tabel dan membuat tabel lain dengan nama yang sama. Anda tidak diperbolehkan menyesuaikan urutan bidang dalam tabel yang ada di lingkungan produksi.

    Move down

    Field name

    Nama bidang. Nama dapat berisi huruf, angka, dan garis bawah (_).

    Field type

    Tipe data bidang. EMR mendukung tipe data berikut: TINYINT, SMALLINT, INT, BIGINT, FLOAT, DOUBLE, DECIMAL, VARCHAR, CHAR, STRING, BINARY, DATETIME, DATE, TIMESTAMP, BOOLEAN, ARRAY, MAP, dan STRUCT.

    Length/Settings

    Batas panjang bidang. Jika tipe data yang Anda tentukan untuk bidang memerlukan batas panjang, Anda harus mengonfigurasi parameter ini.

    Description

    Deskripsi bidang.

    Primary key

    Menentukan apakah bidang berfungsi sebagai kunci utama. Kunci utama adalah konsep bisnis yang memastikan keunikan catatan untuk bisnis Anda. DataWorks tidak memiliki batasan pada kunci utama.

    Edit

    Anda dapat mengklik tombol ini untuk sebuah bidang untuk mengedit bidang tersebut dan klik Save.

    Delete

    Anda dapat mengklik tombol ini untuk sebuah bidang untuk menghapus bidang tersebut.

    Catatan

    Jika Anda ingin menghapus bidang dari tabel yang ada dan kemudian menyimpan tabel, Anda harus menghapus tabel dan membuat tabel lain dengan nama yang sama. Anda tidak diperbolehkan melakukan operasi ini di lingkungan produksi.

    Add

    Jika Anda mengatur parameter Partition type ke Partition table di bagian Physical model design, Anda harus mengonfigurasi partisi untuk tabel.

    Anda dapat mengklik tombol ini untuk menambahkan partisi ke tabel saat ini. Jika Anda ingin menambahkan partisi ke tabel yang ada dan kemudian menyimpan tabel, Anda harus menghapus tabel dan membuat tabel lain dengan nama yang sama. Anda tidak diperbolehkan menambahkan partisi ke tabel yang ada di lingkungan produksi.

  8. Klik ikon 提交 di bilah alat atas untuk menyimpan tabel EMR ke lingkungan produksi.

    Jika Anda menggunakan ruang kerja dalam mode standar, simpan tabel ke lingkungan pengembangan dan lingkungan produksi secara berurutan.

    Catatan

    Anda harus memilih grup sumber daya untuk penjadwalan ketika menyimpan tabel. Jika Anda menggunakan grup sumber daya serverless untuk menyimpan tabel, DataWorks akan mengeluarkan tugas pembuatan tabel ke mesin komputasi dan menampilkan log run. Jika terjadi kesalahan saat menyimpan tabel, Anda dapat menggunakan log run untuk memecahkan masalah. Jika tidak ada grup sumber daya serverless yang tersedia, Anda dapat membeli dan mengonfigurasi grup sumber daya serverless. Untuk informasi lebih lanjut, lihat Buat dan gunakan grup sumber daya serverless.