Untuk beban kerja intensif data yang memerlukan optimasi dalam penyalinan dan transformasi aliran data di DRAM, memori persisten, serta proses pemrosesan data lainnya, gunakan Intel® Data Streaming Accelerator (DSA). DSA adalah akselerator replikasi dan transformasi data berperforma tinggi yang terintegrasi ke dalam Prosesor Intel® Sapphire Rapids dari Instance ECS Elastic Compute Service (ECS) dengan arsitektur SHENLONG generasi kedelapan. Setelah ack-koordinator diinstal pada kluster Container Service for Kubernetes (ACK), fitur akselerasi DSA akan diaktifkan secara otomatis.
Manfaat
Intel® DSA terintegrasi ke dalam prosesor Instance ECS dengan arsitektur SHENLONG generasi kedelapan. Alibaba Cloud menyediakan driver terkait berdasarkan Alinux 3. Jika Anda menggunakan model DSA ini sebagai node pekerja dalam kluster ACK dan menginstal ack-koordinator pada Instance ECS, operasi memori akan dialihkan ke DSA untuk mempercepat replikasi dan transformasi data, serta mengurangi jitter CPU selama proses akselerasi. Manfaat utama DSA meliputi:
Meningkatkan kinerja pemrosesan data untuk beban kerja intensif data pada node, termasuk optimalisasi operasi memori seperti penyeimbangan dan pemadatan memori di kernel OS, sehingga meningkatkan performa keseluruhan memori node.
Secara signifikan meningkatkan kinerja fitur akselerasi akses memori terdekat dari ack-koordinator dalam menangani permintaan data individual. Konsumsi vCore-detik oleh beban kerja berkurang. Kinerja akselerasi DSA semakin baik seiring dengan meningkatnya penggunaan memori jarak jauh. Kecepatan akses 100.000 hingga 1.000.000 halaman memori meningkat antara 30% hingga 200%, sementara pemanfaatan CPU berkurang. Sekitar 1,7 GB memori aplikasi dipindahkan ke server lokal. Dibandingkan dengan prosesor tanpa integrasi DSA, waktu migrasi berkurang menjadi 31,25%, dan bandwidth meningkat menjadi 320%.
PentingStatistik uji yang disebutkan dalam topik ini bersifat teoretis. Nilai aktual dapat bervariasi tergantung pada lingkungan Anda.
Prasyarat
Aplikasi diterapkan pada instance dengan akses memori non-seragam (NUMA) ganda, terutama model Bare Metal SHENLONG generasi kedelapan. Untuk informasi lebih lanjut tentang tipe Instance ECS, lihat Tipe Instance ECS.
Fitur ini memberikan dukungan optimal untuk model generasi kedelapan seperti ecs.ebmc8i.48xlarge, ecs.c8i.32xlarge, dan ecs.g8i.48xlarge. Kami sarankan menggunakan model-model ini.
ack-koordinator (sebelumnya dikenal sebagai ack-slo-manager) versi 1.2.0-ack1.2 atau lebih baru telah diinstal. Untuk informasi lebih lanjut tentang cara menginstal ack-koordinator, lihat ack-koordinator (sebelumnya dikenal sebagai ack-slo-manager).
Catatanack-koordinator mendukung semua fitur yang disediakan oleh resource-controller. Jika Anda saat ini menggunakan resource-controller, Anda harus menghapus instalasinya sebelum menginstal ack-koordinator. Untuk informasi lebih lanjut tentang cara menghapus resource-controller, lihat Uninstall resource-controller.
Klien kubectl terhubung ke kluster ACK. Untuk informasi lebih lanjut, lihat Dapatkan file kubeconfig kluster dan gunakan kubectl untuk terhubung ke kluster.
Tagihan
Tidak ada biaya yang dikenakan saat Anda menginstal atau menggunakan komponen ack-koordinator. Namun, biaya mungkin dikenakan dalam skenario berikut:
ack-koordinator adalah komponen non-managed yang menggunakan sumber daya node pekerja setelah diinstal. Anda dapat menentukan jumlah sumber daya yang diminta oleh setiap modul saat menginstal komponen tersebut.
Secara default, ack-koordinator mengekspos metrik pemantauan fitur seperti profiling sumber daya dan penjadwalan granular sebagai metrik Prometheus. Jika Anda mengaktifkan metrik Prometheus untuk ack-koordinator dan menggunakan Managed Service for Prometheus, metrik ini dianggap sebagai metrik kustom, dan biaya akan dikenakan untuk metrik ini. Biaya tergantung pada faktor-faktor seperti ukuran kluster Anda dan jumlah aplikasi. Sebelum mengaktifkan metrik Prometheus, kami sarankan Anda membaca topik Tagihan dari Managed Service for Prometheus untuk mempelajari tentang kuota gratis dan aturan tagihan metrik kustom. Untuk informasi lebih lanjut tentang cara memantau dan mengelola penggunaan sumber daya, lihat Kueri jumlah data observabel dan tagihan.
Langkah 1: Aktifkan akselerasi DSA
Komponen ack-koordinator secara otomatis mengaktifkan fitur akselerasi DSA pada node yang terintegrasi dengan DSA. Cukup konfigurasikan Instance ECS di kluster dan terapkan ack-koordinator untuk menggunakan akselerasi DSA.
Jika fitur akselerasi akses memori terdekat diaktifkan di kluster, DSA dapat meningkatkan efek akselerasi. Untuk informasi lebih lanjut tentang cara mengaktifkan akselerasi akses memori terdekat, lihat Aktifkan Akselerasi Akses Memori Terdekat untuk Kontainer.
Langkah 2: Verifikasi akselerasi DSA
Fitur akselerasi akses memori terdekat mendukung migrasi memori dari NUMA jarak jauh aplikasi core-bound ke server lokal secara aman. Ini meningkatkan rasio hit akses memori lokal dan mengoptimalkan akses memori untuk beban kerja intensif memori.
Dalam contoh berikut, ecs.ebmc8i.48xlarge digunakan untuk memverifikasi apakah akselerasi DSA berfungsi sesuai harapan:
Prosedur
Masuk ke node dan jalankan perintah berikut untuk memastikan bahwa prosesor terintegrasi dengan DSA.
Untuk informasi lebih lanjut tentang cara masuk ke node uji, lihat Metode untuk Terhubung ke Instance ECS.
ls /sys/bus/dsaJika tidak ada pesan kesalahan yang muncul dan direktori yang dikembalikan tidak kosong, prosesor telah terintegrasi dengan DSA.
Terapkan aplikasi uji dan aktifkan fitur akselerasi akses memori terdekat untuk aplikasi tersebut.
Kami merekomendasikan Anda untuk menerapkan aplikasi intensif memori, seperti Redis, untuk penyebaran dan verifikasi. Untuk informasi lebih lanjut tentang cara menerapkan aplikasi Redis dan mengaktifkan fitur akselerasi akses memori terdekat, lihat Contoh.
Analisis hasil
Tabel berikut membandingkan pemanfaatan CPU (berdasarkan 1 juta halaman memori) dan waktu migrasi yang diperlukan untuk memigrasi 26,12 GB memori jarak jauh Redis dengan dan tanpa akselerasi DSA diaktifkan:
Skenario | Waktu migrasi (detik) | Pemanfaatan CPU | vCore-detik (detik) |
Akselerasi DSA dinonaktifkan | 9,649 | 1,000 | 9,649 |
Akselerasi DSA diaktifkan | 4,928 | 0,668 | 3,292 |
Data uji menunjukkan bahwa ketika akselerasi DSA diaktifkan, waktu migrasi, pemanfaatan CPU rata-rata, dan vCore-detik berkurang menjadi 51,8%, 66,8%, dan 34,1% dari nilainya ketika akselerasi DSA dinonaktifkan. Hasil ini menunjukkan bahwa DSA dapat mempercepat migrasi memori dan mengurangi konsumsi CPU.
Referensi
DSA dapat meningkatkan efek akselerasi akses memori terdekat. Untuk informasi lebih lanjut tentang cara mengaktifkan akselerasi akses memori terdekat, lihat Aktifkan Akselerasi Akses Memori Terdekat untuk Kontainer.