全部产品
Search
文档中心

MaxCompute:Uji kinerja TPC-DS

更新时间:Jul 02, 2025

MaxCompute menawarkan kinerja unggul di industri dan cocok untuk kueri data terabyte, petabyte, atau bahkan eksabyte. Topik ini menjelaskan cara melakukan pengujian benchmark big data TPC-DS menggunakan dataset publik dan alat uji yang disediakan oleh MaxCompute untuk memverifikasi kinerjanya. MaxCompute menyediakan dua metode pengujian kinerja: Metode 1 adalah pengujian TPC-DS berdasarkan mesin akselerasi query baru MaxQA, dan Metode 2 adalah pengujian TPC-DS berdasarkan mesin MCQA.

Persiapan

  1. Konfigurasikan lingkungan.

    • Sebelum melakukan pengujian TPC-DS, aktifkan MaxCompute dan buat proyek.

    • Metode 1: Aktifkan MaxQA (MaxCompute Query Acceleration 2.0), yang saat ini dalam pratinjau publik. Anda dapat mengklik tautan pratinjau publik untuk berpartisipasi dan merujuk pada rencana pratinjau publik untuk jadwal setiap wilayah.

      • Rujuk ke Ikhtisar MaxQA, aktifkan spesifikasi langganan, dan buat grup Kuota interaktif.

    • Metode 2: Aktifkan MCQA (MaxCompute Query Acceleration 1.0) untuk wilayah lain di mana pratinjau publik MaxQA belum tersedia.

  2. Siapkan alat uji.

    MaxCompute menyediakan alat uji kinerja otomatis TPC-DS untuk membantu Anda menyelesaikan pengujian TPC-DS dengan cepat dan menghasilkan hasil uji secara otomatis.

    Penting

    Alat uji hanya dapat digunakan di Linux dengan Java Development Kit (JDK) versi 1.7 atau lebih baru yang telah diinstal.

    Klik mc_tpcds_benchmark untuk mengunduh lampiran paket alat, lalu jalankan perintah berikut di Server Linux untuk mengekstraknya.

    unzip mc_tpcds_benchmark.zip

    Berikut adalah struktur direktori file yang diekstraksi:

    .
    |_t1c7039e3-2a1d-451b-bfda-d14c49016243-tpc-ds-tool.zip
    |_config
    |_init_tools.sh
    |_load_table.sh
    |_logs
    |_odps_clt
    |_patches
    |_pt.sh
    |_queries_1
    |_queries_1.quality
    |_queries_10
    |_queries_100
    |_queries_1000
    |_queries_10000
    |_queries_100000
    |_querygen.sh
    |_results
    |_run_stream.sh
    |_run_stream.sh.offline
    |_sqls
    |_start_session_only.sh
    |_start_session.sql
    |_start_session.sql_tmp
    |_tools_file
    |_tt.sh
    |_v2.10.1rc3
  3. Dapatkan dataset uji.

    MaxCompute menyediakan dataset publik sehingga Anda tidak perlu menyiapkan data uji sendiri. Semua data disimpan di proyek publik MaxCompute BIGDATA_PUBLIC_DATASET. Untuk informasi lebih lanjut, lihat Ikhtisar Dataset Publik.

    Dataset uji TPC-DS dibagi menjadi dataset 10 GB, 100 GB, 1 TB, dan 10 TB berdasarkan ukuran data. Tabel berikut menjelaskan dataset tersebut:

    Kategori

    Pengenalan

    Nama dataset

    Nama skema

    TPC-DS

    TPC-DS adalah benchmark dukungan keputusan yang memodelkan beberapa aspek umum sistem dukungan keputusan, termasuk kueri dan pemeliharaan data, memungkinkan teknologi baru seperti sistem big data untuk melakukan pengujian benchmark.

    • Dataset uji kinerja TPC-DS 10-GB

    • Dataset uji kinerja TPC-DS 100-GB

    • Dataset uji kinerja TPC-DS 1-TB

    • Dataset uji kinerja TPC-DS 10-TB

    • tpcds_10g

    • tpcds_100g

    • tpcds_1t

    • tpcds_10t

Proses pengujian

Modifikasi file konfigurasi alat uji

Masuk ke direktori mc_tpcds_benchmark dari alat uji yang diekstraksi dan modifikasi file config. Karena alat uji mendukung mode MaxQA dan MCQA, ada sedikit perbedaan dalam konfigurasi yang diperlukan di luar konfigurasi dasar.

Konfigurasi dasar

Item konfigurasi

Deskripsi

Nilai

ODPS_CLT_CMD

Jalur absolut file eksekusi klien MaxCompute.

Klien yang disediakan dalam toolkit ini berada di direktori odps_clt dari direktori kerja. Modifikasi konfigurasi yang sesuai. Untuk informasi lebih lanjut, lihat Hubungkan ke MaxCompute menggunakan klien lokal (odpscmd).

Contoh: /xxxxx/mc_tpcds_benchmark/odps_clt/bin/odpscmd

PROJECT

Proyek MaxCompute yang digunakan untuk pengujian.

Contoh: tpcds_test

SF

Ukuran data pengujian TPC-DS.

Satuan: GB. 1 menunjukkan 1 GB. 1000 menunjukkan 1 TB. Anda dapat mengubah nilainya berdasarkan kebutuhan pengujian.

Nilai default: 1000

Konfigurasi diferensial - Mode MCQA vs MaxQA

Item konfigurasi

Deskripsi

Nilai MCQA

Nilai MaxQA

ODPS_CLT_CMD

Jalur absolut file eksekusi klien MaxCompute.

Klien yang disediakan dalam toolkit ini berada di direktori odps_clt dari direktori kerja. Modifikasi konfigurasi yang sesuai. Untuk informasi lebih lanjut, lihat Hubungkan ke MaxCompute menggunakan klien lokal (odpscmd).

Contoh: /xxxxx/mc_tpcds_benchmark/odps_clt/bin/odpscmd

Contoh: /xxxxx/mc_tpcds_benchmark/odps_clt/bin/odpscmd

PROJECT

Proyek MaxCompute yang digunakan untuk pengujian.

Contoh: tpcds_test

Contoh: tpcds_test

SF

Ukuran data pengujian TPC-DS.

Satuan: GB. 1 menunjukkan 1 GB. 1000 menunjukkan 1 TB. Anda dapat mengubah nilainya berdasarkan kebutuhan pengujian.

Nilai default: 1000. Saat ini, dataset publik MaxCompute menyediakan data dalam empat ukuran: 10 GB, 100 GB, 1 TB, dan 10 TB. Oleh karena itu, SF dapat diatur ke 10, 100, 1000, atau 10000.

Nilai default: 1000. Saat ini, dataset publik MaxCompute menyediakan data dalam empat ukuran: 10 GB, 100 GB, 1 TB, dan 10 TB. Oleh karena itu, SF dapat diatur ke 10, 100, 1000, atau 10000.

MODE

Menetapkan mode untuk pelaksanaan benchmark ini

MCQA

MaxQA

MAXQA_QUOTA_NAME

Nama grup Kuota interaktif MaxQA yang digunakan untuk pengujian, yang dapat ditemukan di halaman manajemen kuota konsol MaxCompute. Perhatikan bahwa Anda perlu mengisi alias Kuota (yaitu nama yang Anda berikan sendiri).

N/A

Contoh: maxqa_test_quota

SQL_FLAGS

Parameter bawaan flag MaxCompute. Anda tidak perlu memodifikasi konfigurasi parameter ini.

  • set odps.sql.session.result.cache.enable=false: Menonaktifkan cache hasil dalam mode MCQA untuk memastikan setiap kueri dieksekusi secara independen.

  • set odps.sql.allow.cartesian=true: Mengaktifkan SQL untuk mendukung perhitungan Produk Kartesius.

  • set odps.sql.session.query.timeout=600: Batas waktu untuk pekerjaan Fuxi dalam mode MCQA.

  • set odps.sql.mcqa2.result.cache.enable=false: Menonaktifkan cache hasil dalam mode MaxQA untuk memastikan setiap kueri dieksekusi secara independen.

  • set odps.sql.allow.cartesian=true: Mengaktifkan SQL untuk mendukung perhitungan Produk Kartesius.

Jalankan pengujian

Jalankan perintah berikut di direktori mc_tpcds_benchmark untuk memulai pengujian TPC-DS:

nohup sh pt.sh > pt.log 2>&1 &

Setelah berhasil dieksekusi, file log pt.log secara otomatis dihasilkan di direktori mc_tpcds_benchmark. Anda dapat menjalankan perintah berikut untuk melihat log tugas secara rinci:

tail -f pt.log

Lihat status eksekusi tugas MaxCompute

Anda dapat masuk ke konsol MaxCompute, ganti wilayah di pojok kiri atas, dan pilih Workspace > Jobs di panel navigasi sisi kiri. Di halaman Manajemen Pekerjaan, Anda dapat memeriksa status eksekusi tugas. Anda juga dapat mengklik Actions di kolom pekerjaan target lalu klik LogView untuk melihat detail pekerjaan. Untuk informasi lebih lanjut, lihat Kelola Pekerjaan.

作业运维1

Lihat hasil uji

Setelah tugas berhasil dieksekusi, file hasil uji console_test_result.csv secara otomatis dihasilkan di direktori mc_tpcds_benchmark. Anda dapat melihat hasil eksekusi uji, termasuk total waktu yang dikonsumsi, waktu eksekusi setiap kueri, dan informasi Logview yang sesuai.