All Products
Search
Document Center

Elastic Compute Service:Aktifkan eRDMA

Last Updated:Jul 16, 2025

Anda dapat membuat instance Elastic Compute Service (ECS) dari jenis yang mendukung elastic Remote Direct Memory Access (eRDMA) dan mengikat antarmuka RDMA elastis (ERI) ke instance tersebut untuk menggunakan eRDMA serta memanfaatkan kemampuan jaringan skala besar dan latensi rendah dari RDMA. ERI adalah elastic network interfaces (ENI) dengan fitur ERI diaktifkan.

Aktifkan eRDMA pada instance ECS

Langkah 1: Periksa apakah tipe instance atau image mendukung eRDMA

Hanya beberapa tipe instance dan image yang mendukung eRDMA:

  • Untuk informasi tentang tipe instance berbasis CPU tingkat perusahaan dan image yang mendukung eRDMA, lihat Batasan.

  • Untuk informasi tentang tipe instance dengan akselerasi GPU dan image yang mendukung eRDMA, lihat Batasan.

Langkah 2: Instal driver eRDMA pada instance ECS

Penting
  • Driver eRDMA dikembangkan secara internal oleh Alibaba Cloud. Alibaba Cloud menyediakan dukungan teknis untuk driver ini.

  • Proses instalasi driver eRDMA memerlukan waktu untuk diselesaikan.

  • Paket Instalasi Driver eRDMA

    Catatan Rilis untuk Paket Instalasi Versi Driver eRDMA (Diurutkan Berdasarkan Tanggal Rilis, dari Terbaru hingga Terlama)

    Versi

    Tanggal rilis

    Tautan unduhan

    Checksum

    Deskripsi

    1.4.5

    2025-4-29

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.4.5.tar.gz

    • MD5: 37c89059d005aebe5d8bbde530b5bf56

    • SHA256: 83d810301f9141ca6f387a7e0cf99c89f40b27d484a312eb1d1bd605ebf8bc28

    • Dukungan untuk mode pengguna qp flush.

    • Perbaikan pada rdma-core core library.

    • Program instalasi mendukung sistem operasi Rocky Linux 8.

    1.4.3

    2025-3-13

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.4.3.tar.gz

    • MD5: 417d2fb88af5832475c7285187f57c11

    • SHA256: f82c1eb7a5f93387185a6c0ce7a78c39495d8a07a3e2ee8248cec8b9d525ba2f

    • MLNX OFED 24.10 didukung.

    • Ubuntu24.04 didukung.

    1.4.0

    2024-9-27

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.4.0.tar.gz

    • MD5: 77135d946dddc015000c8f3ea4e6c586

    • SHA256: 8613d3d81e8eb3b78bf840c37cbe02c79f62631df36cdc8b2c7c101f49f5af29

    Kinerja dalam skenario berbasis GPU heterogen dioptimalkan.

    1.3.3

    2023-10-09

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.3.3.tar.gz

    • MD5: 51ffb06266255139554275bc86fa4caa

    • SHA256: 5aad6d006662bd902ef5e913fb97d2a6623aadeeacd06f1c3f1c74cbd1f57ded

    Versi ini diperbarui untuk menyertakan patch terbaru.

    1.3.2

    2023-9-8

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.3.2.tar.gz

    • MD5: 8492016fc96eece6a60687b0e4ea66dd

    • SHA256: 89ab265dc9fa8d56f1b2d8b13d7f50032390a265eddb2e04eeee3aa86fd169ce

    Versi ini diperbarui untuk menyertakan patch terbaru.

    1.3.1

    2023-8-18

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.3.1.tar.gz

    • MD5: b9b90212e6ba49d57b81d3c5d4210deb

    • SHA256: 4ebe31760443613f8f61fcdbef7a85b277dabc59039d048898536ea4fe5d8d4a

    Mode transmisi urutan kuat dapat disetel di sisi driver. Dalam mode urutan kuat, paket data hanya ditransmisikan ke memori secara berurutan.

    1.3.0

    2023-6-26

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.3.0.tar.gz

    • MD5: 2da0c65643b5e2ffb61d75e1b5e5a7ab

    • SHA256: cce03aac0e07d0890884c35ad4f10e9d15f587535d788c8fc97ea268312ad4a9

    • Tabel halaman multi-level didukung selama pendaftaran wilayah memori (MR).

    • Fitur IPv6 didukung, dan diperlukan dukungan IPv6 dari perangkat keras bawah.

    • Ubuntu 22.04 didukung.

    • Versi ini diperbarui untuk menyertakan patch terbaru.

    1.2.3

    30 Mei 2023

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.2.3.tar.gz

    • MD5: 7496a6324f3872469d7194c2e234b19f

    • SHA256: 16c2de0d90da6906db91c2e2469aaad9e24131c44ce52b9464036f1c3747f8a2

    Versi ini diperbarui untuk menyertakan patch terbaru.

    1.2.2

    2023-5-4

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.2.2.tar.gz

    • MD5: f449d3961a41ff6a97a53cfa29e20d6c

    • SHA256: 11fdb4b3c778762ad0bdf2d0327008aa2ecb22dc508c9f9fae3568b41ae5462b

    Ubuntu 22.04 didukung.

    1.2.1

    2023-4-4

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.2.1.tar.gz

    • MD5: e080103934da76ce83924da789aecece

    • SHA256: be3a89e57143d7544cf968052250df92f911aebb035f07b06ebeb8c5f13bf976

    Versi ini diperbarui untuk menyertakan patch terbaru.

    1.2.0

    2023-3-9

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.2.0.tar.gz

    • MD5: c8d440a6e35ec6d2aaf1a568affea876

    • SHA256: d484997e28e29f862dc580c112b55b389a00faf88dc6aa89eea588ee1369a8ca

    • Mode Compat (mode kompatibel) didukung.

    • Versi ini diperbarui untuk menyertakan patch terbaru.

    1.1.0

    2023-1-16

    http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-1.1.0.tar.gz

    • MD5: 1fea69d819919a77384f902213eb681e

    • SHA256: 176c3bb35d5584e8c8e43eba9b1824b8cb2b43a19d802c4e469363ed8e33fea6

    Versi ini diperbarui untuk menyertakan patch terbaru.

  • Instal Driver eRDMA

    Anda dapat menginstal driver eRDMA secara otomatis dengan memilih opsi Auto-install eRDMA Driver saat membuat instance ECS yang mendukung eRDMA, atau menginstalnya secara manual setelah instance dibuat.

  • Periksa Versi Driver eRDMA Mode Kernel

    Setelah driver eRDMA diinstal, Anda dapat menjalankan perintah eadm ver untuk memeriksa versi driver eRDMA mode kernel. Versi driver eRDMA terbaru 1.4.5 sesuai dengan versi driver eRDMA mode kernel 0.2.38.

    image

    eRDMA mendukung mode instalasi berikut untuk driver eRDMA mode kernel. Pilih mode instalasi berdasarkan metode yang digunakan untuk menetapkan koneksi eRDMA. Untuk informasi tentang metode penentuan koneksi, lihat Deskripsi Metode Penentuan Koneksi.

    • Standard: Driver eRDMA mode kernel diinstal dalam mode Standard dan hanya mendukung koneksi RDMA Connection Manager (CM).

      Penting

      Secara default, Keluarga Instance Berbasis CPU yang Mendukung eRDMA menginstal driver eRDMA mode kernel dalam mode Standard. Dalam mode ini, hanya metode penentuan koneksi RDMA_CM yang didukung.

    • Compat: Driver eRDMA mode kernel diinstal dalam mode Compat (mode kompatibel) dan mendukung koneksi RDMA CM dan out-of-band (OOB).

      Penting

Langkah 3: Mengikat ERI ke instance ECS

Anda dapat mengaktifkan fitur ERI untuk ENI utama saat membuat instance ECS atau mengikat ERI ke instance ECS setelah instance dibuat.

Catatan

Untuk memeriksa jumlah maksimum ERI yang dapat Anda ikat ke instance ECS dari tipe tertentu, panggil operasi DescribeInstanceTypes dan periksa nilai parameter EriQuantity dalam respons. Nilai 0 menunjukkan bahwa Anda tidak dapat mengikat ERI ke instance ECS dari tipe tersebut.

  • Buat ERI dan Ikat ERI ke Instance ECS

  • Aktifkan Fitur ERI untuk ENI yang Diikat ke Instance ECS

    Anda dapat mengaktifkan fitur ERI untuk ENI yang diikat ke instance ECS dengan memodifikasi atribut ENI. Untuk informasi lebih lanjut, lihat bagian Ubah Status Fitur ERI untuk ENI yang Ada pada topik "ERI".

  • Panggil Operasi API untuk Membuat ERI dan Mengikat ERI ke Instance ECS

    Lakukan langkah-langkah berikut:

    1. Panggil operasi API untuk membuat ERI.

      Panggil operasi CreateNetworkInterface untuk membuat ENI dan atur parameter NetworkInterfaceTrafficMode ke HighPerformance untuk mengaktifkan fitur ERI untuk ENI.

      Setelah pemanggilan berhasil, catat nilai pengembalian parameter NetworkInterfaceId, yang merupakan ID ERI.

    2. Atur parameter NetworkInterfaceId ke nilai pengembalian yang dicatat pada langkah sebelumnya dan parameter InstanceId ke ID instance ECS dan panggil operasi AttachNetworkInterface untuk mengikat ERI ke instance ECS.

      Penting

      Jika tipe instance ECS mendukung beberapa ERI per instance, kami sarankan Anda mengatur parameter NetworkCardIndex ke nilai berbeda untuk setiap ERI saat mengikat beberapa ERI ke instance. Ini memastikan bahwa ERI diikat ke saluran berbeda dan bandwidth jaringan maksimum dicapai untuk instance. Untuk informasi lebih lanjut, lihat Indeks Kartu Jaringan.

Verifikasi kebenaran konfigurasi eRDMA

Perintah ibv_devinfo membantu memeriksa apakah eRDMA berfungsi seperti yang diharapkan. Anda dapat menjalankan perintah ibv_devinfo untuk mendapatkan informasi tentang perangkat, seperti atribut perangkat keras, status port, dan fitur yang didukung oleh perangkat. Jika setidaknya satu port berada dalam keadaan PORT_ACTIVE, komponen RDMA berjalan seperti yang diharapkan, dan fitur RDMA diaktifkan dan dapat digunakan sesuai harapan. Untuk informasi lebih lanjut, lihat 13.7. Pengujian Operasi RDMA InfiniBand Awal.

Anda juga dapat melewati parameter -v ke perintah ibv_devinfo untuk menanyakan informasi lebih rinci tentang setiap perangkat, termasuk versi perangkat keras, ukuran pesan maksimum yang didukung, jumlah antrian, dan ukuran jendela memori. Anda dapat mengoptimalkan dan memeriksa kinerja jaringan RDMA berdasarkan informasi di atas.

Anda dapat menjalankan perintah ibv_devinfo untuk memverifikasi kebenaran konfigurasi eRDMA pada instance ECS.

  • Konfigurasi eRDMA yang Benar: ERI diikat ke instance ECS, dan driver eRDMA diinstal pada instance sesuai harapan.

    Catatan
    • Jika instance mendukung dan diikat dengan beberapa ERI dan bidang state untuk port setiap perangkat eRDMA pada instance adalah PORT_ACTIVE, ERI berfungsi sesuai harapan.

    • Jika bidang state untuk port ERI adalah invalid state, ERI tidak normal. Dalam hal ini, periksa apakah ERI dikonfigurasi dengan benar. Misalnya, jalankan perintah ifconfig untuk memeriksa apakah semua konfigurasi, termasuk alamat IP, dari ERI ada. Untuk informasi lebih lanjut, lihat Konfigurasikan ENI Sekunder.

    image

  • Driver eRDMA Tidak Diinstal Sesuai Harapan: Gambar berikut menunjukkan bahwa driver eRDMA tidak diinstal pada instance sesuai harapan. Dalam hal ini, Anda harus menginstal ulang driver eRDMA pada instance. Untuk informasi lebih lanjut, lihat bagian Langkah 2: Instal Driver eRDMA pada Instance ECS dari topik ini.

    image

  • Tidak Ada ERI yang Diikat ke Instance: Driver eRDMA diinstal pada instance, tetapi tidak ada ERI yang diikat ke instance. Dalam hal ini, Anda harus mengikat ERI ke instance. Untuk informasi lebih lanjut, lihat bagian Langkah 3: Ikat ERI ke Instance ECS dari topik ini.

    image

Anda juga dapat menggunakan alat diagnostik untuk memeriksa fungsi dasar eRDMA. Untuk informasi lebih lanjut, lihat bagian Gunakan Alat Diagnostik untuk Memeriksa Masalah Terkait RDMA dan Evaluasi Kinerja eRDMA dari topik "Monitor dan Periksa eRDMA".

Uji kinerja jaringan eRDMA

Perftest adalah toolkit pengujian kinerja yang menyediakan berbagai opsi pengujian untuk mengevaluasi operasi jaringan, seperti operasi pengiriman, penerimaan, pembacaan, dan penulisan. Perftest memungkinkan Anda mengukur metrik kinerja, seperti latensi dan bandwidth, dari operasi RDMA. Anda dapat menentukan kinerja perangkat dan jaringan RDMA berdasarkan pengukuran dan mengoptimalkan konfigurasi atau menyelesaikan masalah potensial. Untuk informasi lebih lanjut, lihat perftest.

Program pengujian yang termasuk dalam perftest

Perftest mencakup kumpulan program pengujian. Anda dapat menggunakan program pengujian berdasarkan kebutuhan bisnis Anda untuk menguji bandwidth jaringan atau latensi dan mengevaluasi kinerja jaringan. Tabel berikut menjelaskan program pengujian.

Operasi RDMA

Program pengujian bandwidth

Program pengujian latensi

Kirim

ib_send_bw (pengujian bandwidth pengiriman)

ib_send_lat (pengujian latensi pengiriman)

RDMA Read

ib_read_bw (pengujian bandwidth pembacaan)

ib_read_lat (pengujian latensi pembacaan)

RDMA Write

ib_write_bw (pengujian bandwidth penulisan)

ib_write_lat (pengujian latensi penulisan)

RDMA Atomic

ib_atomic_bw (pengujian bandwidth atomik)

ib_atomic_lat (pengujian latensi atomik)

Ethernet Asli

raw_ethernet_bw (pengujian bandwidth Ethernet mentah)

raw_ethernet_lat (pengujian latensi Ethernet mentah)

Instal perftest

Anda dapat mengunduh paket perftest dari repositori resmi perftest dan menginstal perftest, atau menggunakan repositori Yellowdog Updater, Modified (YUM) atau Advanced Packaging Tool (APT) untuk menginstal perftest.

Repositori resmi perftest
  1. Aktifkan bandwidth publik untuk instance ECS tempat Anda ingin menginstal perftest. Untuk informasi lebih lanjut, lihat Aktifkan Bandwidth Publik.

  2. Unduh paket perftest dari repositori resmi perftest dan instal perftest.

Repositori YUM atau APT
Catatan

Versi perftest yang berbeda disertakan dalam repositori distribusi Linux yang berbeda. Ketidaksesuaian mungkin terjadi. Untuk mencegah ketidaksesuaian, kami sarankan Anda mengidentifikasi distribusi Linux yang dijalankan oleh instance ECS tempat Anda ingin menginstal perftest dan menginstal versi perftest yang disertakan dalam repositori distribusi Linux yang sama. Jika tidak, unduh paket perftest dari repositori resmi perftest dan instal perftest.

  • Alibaba Cloud Linux 3/CentOS/Anolis OS

    sudo yum install perftest -y
  • Ubuntu

    sudo apt install perftest -y

Contoh penggunaan perftest

Anda dapat menjalankan setiap program pengujian yang termasuk dalam perftest sebagai perintah terpisah. Sebagai contoh, jalankan ib_send_lat untuk melakukan pengujian latensi pengiriman.

Pengaturan parameter pengujian yang tepat sangat penting saat menggunakan perftest untuk pengujian kinerja. Dengan mengonfigurasi parameter secara benar, Anda dapat mengontrol perilaku perftest dengan lebih akurat guna memenuhi persyaratan pengujian tertentu dan mendapatkan hasil yang lebih presisi. Tabel berikut menjelaskan parameter kritis dari perftest.

Parameter Pengujian Umum

Anda dapat menjalankan <Subcommand> -h untuk melihat daftar parameter pengujian beserta cara mengonfigurasinya.

Kategori pengujian

Parameter pengujian

Pengujian latensi

  • -C, --report-cycles: Laporkan waktu dalam unit siklus CPU. Parameter ini membantu dalam mengukur latensi secara akurat.

  • -H, --report-histogram: Cetak semua hasil. Secara default, hanya ringkasan yang dicetak. Parameter ini membantu Anda memahami distribusi data.

  • -U, --report-unsorted: Cetak hasil yang tidak disortir. Anda dapat menentukan parameter ini untuk menganalisis distribusi data asli. Secara default, hasil yang disortir dicetak.

Pengujian bandwidth

  • -b, --bidirectional: Ukur bandwidth dua arah. Secara default, bandwidth satu arah diukur. Parameter ini adalah metrik penting berdasarkan mana Anda dapat menentukan kemampuan transmisi dua arah jaringan.

  • -N, --no peak-bw: Batalkan perhitungan bandwidth puncak (peak-bw). Secara default, perhitungan bandwidth puncak tidak dibatalkan. Ini memungkinkan Anda fokus pada kinerja bandwidth stabil.

  • -t, --tx-depth=<dep>: Tentukan ukuran antrian transmisi (Tx), yang memengaruhi konkurensi dan kinerja pengujian. Nilai default: 128.

  • -D, --duration=<sec>: Jalankan pengujian selama periode detik yang disesuaikan.

Pengujian pengiriman

  • -r, --rx-depth=<dep>: Tentukan ukuran antrian penerimaan (Rx), yang memengaruhi ukuran buffer dan kinerja. Nilai default: 512.

  • -g, --mcg=<num_of_qps>: Kirim pesan ke grup multicast tempat <num_of_qps> Queue Pairs (QPs) dilampirkan. Parameter ini membantu dalam menguji kinerja multicast.

Opsi lanjutan lainnya

  • -u, --qp-timeout=<timeout>: Tentukan timeout QP. Unit: mikrodetik. Nilai default: 14. Timeout QP dihitung menggunakan rumus berikut: 4 × 2^(-u).

  • --force-link=<type>: Paksa tautan ke jenis tertentu: IB atau Ethernet. Anda dapat menentukan parameter ini untuk menguji jenis tautan jaringan tertentu.

  • --use_hugepages: Gunakan Hugepages alih-alih alokasi contig atau memalign. Ini memungkinkan Anda mengoptimalkan penggunaan memori dan kinerja.

  • --rate_limit=<limit>: Tetapkan laju maksimum paket yang dikirim. Unit default: Gbit/s. Anda dapat menggunakan parameter --rate_units untuk mengubah unit laju maksimum.

Referensi

  • Jika Anda menyebarkan aplikasi dalam kontainer Docker pada instance Anda, Anda dapat menggunakan eRDMA di dalam kontainer untuk mencapai transfer data skala besar dan komunikasi jaringan berkinerja tinggi. Untuk informasi lebih lanjut, lihat Aktifkan eRDMA dalam kontainer Docker.

  • Anda dapat menggunakan eRDMA dalam kluster Alibaba Cloud Container Service for Kubernetes (ACK) untuk menyediakan kemampuan komunikasi jaringan berlatensi rendah dan throughput tinggi bagi semua layanan dan aplikasi dalam kluster. Untuk informasi lebih lanjut, lihat Gunakan eRDMA untuk mempercepat jaringan kontainer dalam kluster ACK.

  • Anda dapat memantau dan memeriksa status waktu nyata eRDMA. Untuk informasi lebih lanjut, lihat Pantau dan periksa eRDMA.

  • Anda dapat mengintegrasikan eRDMA ke dalam aplikasi TCP. Untuk informasi lebih lanjut, lihat Ikhtisar adaptasi eRDMA dan aplikasi.