Topik ini menjelaskan cara mengoptimalkan biaya penyimpanan melalui konfigurasi partisi data, siklus hidup tabel, dan penghapusan berkala tabel yang sudah tidak digunakan.
Berikut adalah beberapa operasi yang dapat Anda lakukan untuk mengoptimalkan biaya penyimpanan:
Konfigurasikan partisi data dengan tepat.
Tetapkan siklus hidup yang masuk akal untuk tabel.
Hapus secara berkala tabel yang sudah tidak digunakan.
Konfigurasikan partisi data dengan tepat
Dalam MaxCompute, setiap nilai dari kolom kunci partisi disebut partisi. Anda dapat mengelompokkan beberapa bidang tabel dalam satu partisi untuk membuat partisi multi-level, yang mirip dengan direktori multi-level. Dengan menentukan nama partisi tertentu, sistem hanya membaca data dari partisi tersebut tanpa memindai seluruh tabel, sehingga mengurangi biaya dan meningkatkan efisiensi.
Jika periode minimum untuk pengumpulan data adalah satu hari, kami sarankan menggunakan bidang tanggal sebagai bidang partisi. Sistem akan memigrasikan data ke partisi yang ditentukan setiap hari, kemudian membaca data dari partisi tersebut untuk operasi berikutnya.
Jika periode minimum untuk pengumpulan data adalah satu jam, kami sarankan menggunakan kombinasi bidang tanggal dan jam sebagai bidang partisi. Sistem akan memigrasikan data ke partisi yang ditentukan setiap jam, kemudian membaca data dari partisi tersebut untuk operasi berikutnya. Jika data yang dikumpulkan setiap jam dipartisi berdasarkan tanggal saja, jumlah data di setiap partisi akan bertambah setiap jam, menyebabkan pembacaan sejumlah besar data yang tidak perlu dan meningkatkan biaya penyimpanan.
Anda dapat menyesuaikan bidang partisi sesuai dengan kebutuhan bisnis Anda. Selain bidang tanggal dan waktu, Anda dapat menggunakan bidang lain dengan jumlah nilai enumerasi yang relatif tetap, seperti saluran, negara, atau provinsi. Atau, Anda dapat menggunakan kombinasi waktu dan bidang lain sebagai bidang partisi. Kami sarankan menentukan dua tingkat partisi dalam sebuah tabel. Setiap tabel mendukung maksimum 60.000 partisi.
Konfigurasikan siklus hidup yang masuk akal untuk tabel
Saat membuat tabel, Anda dapat mengonfigurasi siklus hidupnya berdasarkan penggunaan data. MaxCompute akan menghapus data yang melebihi ambang batas siklus hidup secara otomatis, sehingga menghemat ruang penyimpanan.
Sebagai contoh, Anda dapat mengeksekusi pernyataan berikut untuk membuat tabel dengan siklus hidup 100 hari. Jika modifikasi terakhir tabel atau partisi terjadi lebih dari 100 hari yang lalu, MaxCompute akan menghapus tabel atau partisi tersebut.
CREATE TABLE test3 (key BOOLEAN) PARTITIONED BY (pt STRING, ds STRING) LIFECYCLE 100;Siklus hidup mengambil partisi sebagai unit terkecil. Jika beberapa partisi dalam tabel berpartisi mencapai ambang batas siklus hidup, partisi tersebut akan dihapus, sementara partisi lainnya tetap tidak terpengaruh.
Anda dapat mengeksekusi pernyataan berikut untuk memodifikasi pengaturan siklus hidup tabel yang ada. Untuk informasi lebih lanjut, lihat Operasi Manajemen Siklus Hidup.
ALTER TABLE table_name SET lifecycle days;Hapus secara berkala tabel yang sudah tidak digunakan
Kami sarankan Anda secara berkala menghapus tabel yang sudah tidak digunakan, termasuk tabel yang tidak diakses dalam jangka waktu lama. Berikut adalah kriteria tabel yang dianggap sudah tidak digunakan:
Tabel yang tidak diakses dalam tiga bulan terakhir.
Tabel non-partisi yang tidak diakses dalam sebulan terakhir.
Tabel yang tidak mengonsumsi sumber daya penyimpanan.