全部产品
Search
文档中心

Elastic Compute Service:Aktifkan eRDMA pada instans tingkat enterprise

更新时间:Jan 30, 2026

Beberapa instans Elastic Compute Service (ECS) tingkat enterprise mendukung elastic Remote Direct Memory Access (eRDMA). Fitur ini menyediakan layanan jaringan RDMA berkinerja tinggi dengan latensi ultra-rendah, throughput tinggi, dan elastisitas tinggi tanpa memerlukan perubahan pada arsitektur jaringan yang sudah ada. Topik ini menjelaskan cara mengaktifkan eRDMA pada instans ECS tingkat enterprise.

Batasan

Batasan

Deskripsi

Tipe instans

Keluarga instans berikut mendukung eRDMA:

Beberapa tipe instans, seperti g9ae, c9ae, r9ae, g9a, c9a, r9a, dan u2a, memerlukan empat vCPU atau lebih untuk mendukung eRDMA.

Klik untuk melihat tipe instans yang didukung

Image

  • Alibaba Cloud Linux 3 (disarankan)

  • Alibaba Cloud Linux 2 (hanya untuk sistem berbasis x86)

  • CentOS 7.9 (hanya untuk sistem berbasis x86)

  • Ubuntu 18.04, 20.04, 22.04, atau 24.04

  • Anolis OS 8.4 ANCK atau 8.6 ANCK (hanya untuk sistem berbasis Arm)

Catatan

Image yang tersedia bervariasi tergantung pada tipe instans. Image yang tersedia di halaman pembelian instans bersifat final.

Jumlah perangkat eRDMA

Untuk mengetahui jumlah maksimum ERI yang dapat Anda bind ke instans ECS dengan tipe instans tertentu, panggil operasi DescribeInstanceTypes dan periksa nilai parameter EriQuantity dalam respons. Nilai 0 menunjukkan bahwa Anda tidak dapat mengikat ERI ke instans ECS dengan tipe instans tersebut.

Batasan jaringan

  • Anda tidak dapat menetapkan alamat IPv6 ke ENI setelah mengaktifkan fitur ERI untuk ENI tersebut.

  • Ketika dua instans berkomunikasi melalui koneksi eRDMA, jalur komunikasi tidak boleh melewati elemen jaringan, seperti instans Server Load Balancer (SLB).

  • Instans GPU-accelerated yang mendukung eRDMA tidak dapat langsung berkomunikasi dengan instans tingkat enterprise yang mendukung eRDMA karena keduanya menggunakan mode kerja eRDMA yang berbeda. Untuk mengaktifkan komunikasi, deploy eRDMA pada instans tingkat enterprise dengan cara yang sama seperti pada instans GPU-accelerated. Ini mencakup instalasi driver eRDMA dan OpenFabrics Enterprise Distribution (OFED) serta menyambungkan ERI ke instans tingkat enterprise. Untuk informasi selengkapnya, lihat Aktifkan eRDMA pada instans GPU-accelerated.

Konfigurasikan eRDMA untuk instans tingkat enterprise

Konfigurasikan eRDMA saat membuat instans

Penting
  • Jika sistem operasi tidak mendukung driver eRDMA atau instalasi otomatis gagal, Anda dapat menginstal driver menggunakan skrip atau secara manual setelah instans dibuat. Untuk informasi selengkapnya, lihat Konfigurasikan eRDMA untuk instans yang sudah ada.

  • Setelah instans dimulai, instalasi driver eRDMA mungkin memerlukan waktu untuk selesai.

  1. Buka halaman pembelian instans.

  2. Buat instans tingkat enterprise yang mendukung ERI. Selama proses pembuatan, perhatikan item konfigurasi berikut. Untuk informasi tentang parameter lainnya, lihat Buat instans menggunakan wizard.

    • Instance and Image: Pilih tipe instans yang mendukung eRDMA dan pilih opsi untuk menginstal driver eRDMA.

      • Instance: Untuk informasi selengkapnya, lihat Batasan.

      • Image: Pilih Public Image, lalu pilih Install eRDMA driver. Driver eRDMA akan diinstal secara otomatis saat instans dimulai. Anda tidak perlu melakukan instalasi manual.

        image

    • ENI: Di sebelah kanan Primary ENI, aktifkan fitur ERI untuk menyambungkan ERI ke instans ECS.

      image

      Catatan

      Saat membeli instans tingkat enterprise, Anda hanya dapat mengaktifkan fitur ERI untuk Primary ENI. Untuk mengonfigurasi eRDMA pada secondary ENI, Anda dapat mengaktifkan fitur ERI untuk secondary ENI di Konsol atau dengan memanggil operasi API. Untuk informasi selengkapnya, lihat Elastic RDMA Interface (ERI).

Konfigurasikan eRDMA untuk instans yang sudah ada

  1. Pastikan tipe instans berada dalam daftar tipe instans yang mendukung eRDMA.

    Tipe instans tersebut harus mendukung eRDMA.

  2. Verifikasi bahwa eRDMA telah dikonfigurasi dengan benar untuk instans tersebut.

    • Pertama, verifikasi bahwa eRDMA telah dikonfigurasi dengan benar untuk instans tersebut. Untuk informasi selengkapnya, lihat Verifikasi konfigurasi eRDMA.

    • Jika Anda memastikan bahwa eRDMA belum dikonfigurasi untuk instans tersebut, lakukan langkah-langkah berikut untuk menginstal driver eRDMA dan menyambungkan ERI ke instans.

  3. Instal driver eRDMA pada instans.

    Jika Anda tidak memilih eRDMA driver saat membuat instans, driver tidak akan diinstal secara otomatis. Anda harus menginstalnya secara manual atau menggunakan skrip.

    • Instalasi berbasis skrip: Versi stabil terbaru dari paket driver diunduh secara default.

    • Instalasi manual: Anda dapat mengunduh versi tertentu dari paket driver.

    Instal menggunakan skrip satu klik

    1. Jalankan perintah berikut untuk mengunduh versi stabil terbaru dari paket driver.

      curl -O http://mirrors.cloud.aliyuncs.com/erdma/env_setup.sh
    2. Jalankan perintah berikut untuk menginstal paket driver yang telah diunduh.

      sudo /bin/bash env_setup.sh > /var/log/erdma_install.log 2>&1

      Setelah menjalankan skrip instalasi, skrip tersebut secara otomatis menginstal dependensi perangkat lunak yang diperlukan untuk driver eRDMA, lalu menginstal driver eRDMA. Tunggu hingga skrip selesai dijalankan.

      Catatan

      Jika instalasi driver gagal menggunakan skrip, periksa log instalasi. Jalur log instalasi adalah /var/log/erdma_install.log.

    Instal secara manual langkah demi langkah

    1. Jalankan perintah berikut untuk memperbarui paket perangkat lunak prasyarat.

      • Untuk Alibaba Cloud Linux 3, CentOS, atau Anolis OS:

        sudo yum update -y
      • Untuk Ubuntu: Anda tidak perlu melakukan pembaruan. Lewati langkah ini.

    2. Jalankan perintah berikut secara berurutan untuk melihat versi terbaru paket kernel dan versi kernel sistem operasi.

      rpm -qa | grep kernel  # Lihat versi terbaru paket kernel.
      uname -r  # Lihat versi kernel sistem operasi.

      Jika output perintah mirip dengan contoh berikut, versinya konsisten dan tidak diperlukan tindakan lebih lanjut. Jika versinya tidak konsisten, restart instans agar perubahan diterapkan.

      image.png

    3. Jalankan perintah berikut untuk menginstal paket dependensi.

      • Untuk instans berbasis x86, lakukan operasi berikut:

        • Untuk Alibaba Cloud Linux 3, CentOS, atau Anolis OS:

          sudo yum install gcc-c++ dkms cmake kernel-devel kernel-headers libnl3 libnl3-devel
        • Untuk Ubuntu:

          sudo apt-get install dkms cmake libnl-3-dev libnl-route-3-dev linux-headers-generic
      • Untuk instans berbasis Arm, tugas build dijalankan berdasarkan kode sumber. Proses ini memerlukan banyak dependensi perangkat lunak yang dapat berubah. Anda dapat melewati langkah ini dan langsung menjalankan skrip instalasi. Jika skrip instalasi gagal, skrip tersebut akan meminta Anda untuk menginstal dependensi perangkat lunak yang diperlukan. Instal dependensi sesuai permintaan, lalu jalankan instalasi perangkat lunak lagi.

    4. Jalankan perintah berikut untuk mengunduh paket instalasi driver.

      • Dapatkan paket perangkat lunak dari alamat jaringan internal.

        wget http://mirrors.cloud.aliyuncs.com/erdma/erdma_installer-latest.tar.gz
      • Dapatkan paket perangkat lunak dari alamat Internet.

        wget https://mirrors.aliyun.com/erdma/erdma_installer-latest.tar.gz

      Secara default, versi terbaru dari paket instalasi driver diunduh. Anda juga dapat mengunduh versi tertentu dari paket driver. Untuk informasi tentang rilis berbagai versi paket instalasi eRDMA, lihat Langkah 2: Instal driver eRDMA untuk instans ECS.

    5. Jalankan perintah berikut untuk mengekstrak paket instalasi dan masuk ke direktori file.

      tar -xvf erdma_installer-latest.tar.gz && cd erdma_installer
    6. Jalankan perintah berikut untuk menginstal driver.

      • Metode 1: Konfirmasi secara manual langkah uninstall dan unduh otomatis selama proses instalasi.

        sudo sh install.sh
      • Metode 2: Instal tanpa konfirmasi.

        sudo sh install.sh  --batch

      Konfirmasi hasil instalasi berdasarkan informasi yang dikembalikan.

      Jika informasi berikut dikembalikan, driver berhasil diinstal.

      4.png

      Jika informasi berikut dikembalikan, instalasi driver gagal. Lakukan operasi sesuai petunjuk, lalu coba instal driver lagi.

      5.png

      Catatan

      Jika Anda menggunakan sistem CentOS 7 dan muncul pesan yang menunjukkan paket perangkat lunak hilang saat menginstal ulang driver, tetapi Anda tidak dapat memperoleh paket tersebut menggunakan yum, Anda mungkin perlu menjalankan perintah yum install -y epel-release untuk menginstal repositori EPEL sebelum dapat memperoleh paket tersebut.

  4. Attach ERI to the instance.

    Anda dapat menyambungkan ERI ke instans dengan salah satu cara berikut.

    Catatan

    Untuk mengetahui jumlah maksimum ERI yang dapat Anda bind ke instans ECS dengan tipe instans tertentu, panggil operasi DescribeInstanceTypes dan periksa nilai parameter EriQuantity dalam respons. Nilai 0 menunjukkan bahwa Anda tidak dapat mengikat ERI ke instans ECS dengan tipe instans tersebut.

    • Aktifkan fitur ERI untuk ENI yang terikat ke instans ECS

      Anda dapat mengaktifkan fitur ERI untuk ENI yang terikat ke instans ECS dengan memodifikasi atribut ENI. Untuk informasi selengkapnya, lihat bagian Ubah status fitur ERI untuk ENI yang sudah ada pada topik "ERI".

    • Buat ERI dan ikat ERI ke instans ECS

    • Panggil operasi API untuk membuat ERI dan ikat ERI ke instans ECS

      Lakukan langkah-langkah berikut:

      1. Panggil operasi API untuk membuat ERI.

        Panggil operasi CreateNetworkInterface untuk membuat ENI dan atur parameter NetworkInterfaceTrafficMode ke HighPerformance untuk mengaktifkan fitur ERI pada ENI tersebut.

        Setelah panggilan berhasil, catat nilai kembali parameter NetworkInterfaceId, yaitu ID ERI.

      2. Atur parameter NetworkInterfaceId ke nilai kembali yang dicatat pada langkah sebelumnya dan parameter InstanceId ke ID instans ECS, lalu panggil operasi AttachNetworkInterface untuk mengikat ERI ke instans ECS.

        Penting

        Jika tipe instans ECS mendukung beberapa ERI per instans, kami menyarankan Anda mengatur parameter NetworkCardIndex ke nilai yang berbeda untuk setiap ERI saat mengikat beberapa ERI ke instans. Hal ini memastikan bahwa ERI terikat ke saluran yang berbeda dan bandwidth jaringan maksimum tercapai untuk instans tersebut. Untuk informasi selengkapnya, lihat Indeks kartu jaringan.

Uji latensi tulis eRDMA pada instans

Anda dapat menginstal perftest, lalu menggunakan ib_write_lat untuk menguji latensi tulis pada dua instans tingkat enterprise yang telah dikonfigurasi eRDMA. Untuk informasi selengkapnya tentang pengujian perftest, lihat data pengujian perftest.

Prasyarat

  1. Siapkan dua instans tingkat enterprise yang telah dikonfigurasi eRDMA. Tumpukan perangkat lunak eRDMA harus diinstal dan ERI harus disambungkan ke instans. Satu instans berfungsi sebagai server dan yang lainnya sebagai client.

  2. Pastikan jaringan dikonfigurasi dengan benar dan kedua server dapat berkomunikasi satu sama lain melalui jaringan internal. Untuk informasi selengkapnya, lihat Aktifkan interkoneksi layanan antar instans ECS.

Prosedur

  1. Sambungkan secara remote ke kedua instans.

    Untuk informasi selengkapnya, lihat Sambungkan ke instans Linux menggunakan Workbench.

  2. Verifikasi bahwa konfigurasi eRDMA pada kedua instans sudah benar.

    Untuk informasi selengkapnya, lihat Verifikasi konfigurasi eRDMA.

  3. Jalankan perintah berikut pada kedua instans untuk menginstal tool perftest.

    Anda dapat mengunduh paket perftest dari repositori resmi perftest dan menginstal perftest, atau menggunakan repositori Yellowdog Updater, Modified (YUM) atau Advanced Packaging Tool (APT) untuk menginstal perftest.

    Repositori resmi perftest

    1. Aktifkan bandwidth publik untuk instans ECS tempat Anda ingin menginstal perftest. Untuk informasi selengkapnya, lihat Aktifkan bandwidth publik.

    2. Unduh paket perftest dari repositori resmi perftest dan instal perftest.

    Repositori YUM atau APT

    Catatan

    Versi perftest yang berbeda termasuk dalam repositori distribusi Linux yang berbeda. Ketidakcocokan dapat terjadi. Untuk mencegah ketidakcocokan, kami menyarankan Anda mengidentifikasi distribusi Linux yang dijalankan oleh instans ECS tempat Anda ingin menginstal perftest dan menginstal versi perftest yang termasuk dalam repositori distribusi Linux yang sama. Jika tidak, unduh paket perftest dari repositori resmi perftest dan instal perftest.

    • Alibaba Cloud Linux 3/CentOS/Anolis OS

      sudo yum install perftest -y
    • Ubuntu

      sudo apt install perftest -y
  4. Uji latensi jaringan eRDMA terhadap performa yang diharapkan.

    1. Pada instans server, jalankan perintah berikut untuk menjalankan ib_write_lat sebagai server yang mendengarkan koneksi dari client.

      ib_write_lat -R -a -F
      • -R: menggunakan RDMA_CM untuk membuat koneksi.

        Penting
        • Secara default, tipe instans berbasis CPU yang mendukung eRDMA menginstal driver kernel eRDMA dalam mode Standard. Dalam mode ini, hanya metode pembentukan koneksi RDMA_CM yang didukung. Untuk informasi selengkapnya, lihat Metode pembentukan koneksi.

        • Secara default, perftest membuat koneksi out-of-band (OOB). Saat menjalankan pengujian perftest pada instans berbasis CPU, Anda dapat menentukan parameter -R baik di server maupun client untuk menggunakan metode pembentukan koneksi RDMA_CM. Jika tidak, pengecualian dapat terjadi saat koneksi dibuat.

        • Anda juga dapat menggunakan command line untuk membuat metode pembentukan koneksi RDMA_CM dan OOB kompatibel. Untuk informasi selengkapnya, lihat Modifikasi mode pembentukan koneksi eRDMA dan bRPC untuk memastikan kompatibilitas. Setelah metode tersebut dibuat kompatibel, Anda tidak perlu menambahkan parameter -R ke perintah.

      • -a: menjalankan pengujian untuk semua ukuran pesan, dari 2 byte hingga 2^23 byte. Hal ini memungkinkan Anda menguji pengaruh ukuran pesan yang berbeda terhadap latensi.

      • -F: secara paksa menimpa koneksi yang sudah ada. Artinya, jika koneksi sebelumnya telah dibuat, opsi -F akan mengabaikan koneksi yang ada dan secara paksa membuat koneksi baru.

    2. Pada instans client, jalankan perintah berikut untuk menjalankan ib_write_lat dan terhubung ke server.

      ib_write_lat -R -a -F <server_ip>

      Ganti <server_ip> dengan Alamat IP pribadi dari kartu antarmuka jaringan (NIC) tempat fitur ERI diaktifkan pada instans ECS server. Untuk informasi tentang cara mendapatkan alamat IP, lihat Lihat alamat IP.

    3. Lihat hasil pengujian.

      Setelah pengujian client selesai, ib_write_lat menghasilkan informasi konfigurasi pengujian, informasi koneksi, dan hasil pengujian performa. Hasilnya mencakup statistik terkait latensi, seperti latensi minimum, maksimum, dan rata-rata.

      image

      Deskripsi data latensi dalam hasil pengujian ib_write_lat

      • #bytes: Ukuran pesan. Ini adalah ukuran muatan yang digunakan dalam pengujian, mulai dari 2 byte hingga 8.388.608 byte. Ukuran pesan yang berbeda membantu Anda memahami performa di bawah beban yang berbeda.

      • #iterations: Jumlah iterasi. Ini menunjukkan berapa kali pengujian untuk setiap ukuran pesan diulang. Jumlah iterasi yang tinggi memberikan rata-rata dan statistik yang lebih stabil.

      • t_min[usec]: Latensi minimum. Ini adalah latensi minimum yang dicatat dalam semua pengukuran, dalam mikrodetik. Nilai ini memberikan referensi untuk latensi jaringan terbaik.

      • t_max[usec]: Latensi maksimum. Ini adalah latensi maksimum yang dicatat dalam semua pengukuran, dalam mikrodetik. Latensi maksimum yang tinggi dapat menunjukkan adanya masalah jaringan atau kemacetan sementara.

      • t_typical[usec]: Latensi khas. Ini adalah latensi umum dalam pengujian, dalam mikrodetik. Biasanya merupakan median dari semua nilai yang diukur.

      • t_avg[usec]: Latensi rata-rata. Ini adalah latensi rata-rata dari semua nilai yang diukur, dalam mikrodetik. Nilai ini memberikan kesan umum tentang latensi jaringan.

      • t_stdev[usec]: Deviasi standar latensi. Ini menunjukkan tingkat variasi nilai latensi, dalam mikrodetik. Deviasi standar yang lebih kecil berarti latensi lebih stabil, sedangkan deviasi standar yang lebih besar berarti latensi lebih berfluktuasi.

      • 99% percentile[usec]: Persentil ke-99 latensi. Ini menunjukkan bahwa 99% dari nilai yang diukur berada di bawah nilai ini, dalam mikrodetik. Titik data ini membantu Anda memahami performa latensi dalam kasus ekstrem.

      • 99.9% percentile[usec]: Persentil ke-99,9 latensi. Ini menunjukkan bahwa 99,9% dari nilai yang diukur berada di bawah nilai ini, dalam mikrodetik. Titik data ini membantu Anda memahami performa latensi dalam kasus ekstrem.

      Dengan menggabungkan data ini, Anda dapat memperoleh pemahaman komprehensif tentang performa jaringan RDMA dan menggunakannya untuk optimasi jaringan dan troubleshooting. Misalnya, jika Anda menemukan bahwa latensi tiba-tiba meningkat pada ukuran pesan tertentu, Anda mungkin perlu memeriksa apakah konfigurasi jaringan atau performa perangkat keras memenuhi persyaratan. Jika Anda melihat fluktuasi besar pada latensi, Anda mungkin perlu menyelidiki lebih lanjut kemacetan atau ketidakstabilan pada jaringan.