全部产品
Search
文档中心

Vector Retrieval Service for Milvus:FAQ

更新时间:Sep 24, 2025

Dokumen ini menjelaskan jawaban atas pertanyaan umum dan solusi untuk skenario khas yang mungkin Anda temui saat menggunakan Vector Retrieval Service for Milvus (Milvus).

Pemilihan produk

Bagaimana cara memperkirakan sumber daya komputasi yang diperlukan?

Gunakan kalkulator sumber daya yang disediakan oleh Milvus untuk memperkirakan kebutuhan sumber daya. Sebelum menerapkan layanan, sesuaikan sumber daya berdasarkan hasil pengujian. Untuk informasi lebih lanjut, lihat Perkirakan sumber daya komputasi dengan kalkulator sumber daya.

Bagaimana cara memilih antara Edisi Dasar dan Edisi Standar Milvus?

Pertimbangkan skenario dan kebutuhan Anda:

  • Edisi Dasar (single-node): Ideal untuk pengujian atau pengguna baru Milvus. Memungkinkan eksplorasi cepat fitur-fitur Milvus.

  • Edisi Standar (kluster): Dirancang untuk lingkungan produksi dengan stabilitas tinggi. Pilih Edisi Standar untuk performa dan pengalaman layanan terbaik.

Selama pratinjau publik, baik Edisi Dasar maupun Edisi Standar tidak dilindungi oleh Perjanjian Tingkat Layanan (SLA).

Penggunaan produk

Bagaimana cara mengonfigurasi aturan peringatan?

Untuk mengonfigurasi pemantauan peringatan, buka halaman Monitoring and Alerting di Konsol Milvus, pilih tab Alert Settings, dan aktifkan fitur One-Click Alert. Anda juga dapat mengklik Alert Rule Settings untuk masuk ke Konsol CloudMonitor dan menyesuaikan aturan peringatan.

Bagaimana cara memilih indeks?

Indeks sangat penting untuk mengoptimalkan performa pencarian vektor. Jenis indeks yang berbeda memiliki dampak berbeda pada kecepatan kueri, presisi, dan penggunaan sumber daya. Berikut adalah perbandingan singkat dari jenis indeks Milvus yang umum dan rekomendasi untuk memilih salah satu:

  • IVF_FLAT: Pilihan seimbang untuk sebagian besar skenario.

    • Cara kerjanya: Menggunakan kuantisasi untuk mengurangi kompleksitas komputasi, meningkatkan performa kueri secara signifikan dibandingkan indeks FLAT.

    • Tepat untuk: Skenario dengan set data besar di mana Anda memerlukan keseimbangan baik antara performa kueri, akurasi, dan biaya sumber daya.

  • HNSW (Hierarchical Navigable Small World): Pilihan utama untuk kecepatan dan akurasi.

    • Cara kerjanya: Membangun struktur grafik multi-lapisan untuk menavigasi ruang vektor secara efisien, memungkinkan pencarian cepat dan akurat, terutama dalam data berdimensi tinggi.

    • Tepat untuk: Skenario yang memerlukan kecepatan kueri dan recall tertinggi, memiliki banyak memori dan sumber daya komputasi, serta sering melibatkan data berdimensi tinggi.

  • IVF_SQ8: Indeks padat untuk lingkungan dengan batasan memori.

    • Cara kerjanya: Menggunakan Scalar Quantization (SQ8) untuk menekan setiap vektor, memungkinkan Anda memuat lebih banyak vektor ke dalam jumlah RAM yang sama. Meskipun ini mengurangi biaya memori, langkah kuantisasi dapat menyebabkan penurunan sedikit dalam presisi dibandingkan indeks non-kompres seperti HNSW.

    • Tepat untuk: Skenario di mana ukuran dataset sangat besar dan sumber daya memori adalah hambatan utama. Ini adalah pilihan tepat ketika Anda perlu mempertahankan tingkat recall tinggi dengan anggaran terbatas dan dapat mentolerir penurunan kecil dalam akurasi.

  • FLAT (indeks eksak): Standar emas untuk akurasi 100%.

    • Cara kerjanya: Melakukan pencarian brute-force secara menyeluruh dengan membandingkan vektor kueri terhadap setiap vektor tunggal dalam indeks. Ini adalah satu-satunya metode yang menjamin menemukan tetangga terdekat yang benar dan eksak.

    • Tepat untuk: Aplikasi di mana recall 100% tidak bisa dinegosiasikan, ukuran dataset relatif kecil (misalnya, di bawah beberapa juta), dan latensi kueri bukanlah perhatian utama.

Bagaimana cara mengubah konfigurasi instans?

Anda dapat menanyakan dan mengubah konfigurasi instans di Konsol Milvus untuk memenuhi persyaratan bisnis Anda. Untuk informasi lebih lanjut, lihat Perbarui konfigurasi instans.

Bagaimana cara mereset kata sandi instans?

Penting

Meriset kata sandi untuk instans Milvus memutuskan koneksi antara klien dan server. Lakukan operasi ini di lingkungan produksi selama jam-jam sepi.

Anda dapat mereset kata sandi untuk instans Milvus menggunakan salah satu metode berikut.

Riset kata sandi di konsol

  1. Buka halaman Pengaturan Keamanan.

    1. Masuk ke Konsol Vector Retrieval Service for Milvus.

    2. Di panel navigasi di sebelah kiri, klik Instances.

    3. Di halaman Instances, klik nama instans target.

    4. Klik tab Security Configuration.

  2. Di bagian Cluster Configuration, klik Reset.

  3. Di kotak dialog Reset Kata Sandi, masukkan kata sandi baru di bidang New Password dan Confirm Password, lalu klik OK.

Riset kata sandi menggunakan Python SDK

Anda dapat menjalankan skrip berikut untuk mengubah kata sandi instans.

Catatan

Versi Python SDK harus 2.4 atau lebih baru.

from pymilvus import MilvusClient

# Buat klien Milvus.
client = MilvusClient(
    uri="http://c-b26606e936****.milvus.aliyuncs.com:19530",  # Titik akhir publik dari instans Milvus.
    token="<yourUsername>:<yourPassword>",  # Nama pengguna dan kata sandi untuk masuk ke instans Milvus.
    db_name="default"  # Nama database untuk terhubung. Contoh ini menggunakan database default.
)

client.update_password(
    user_name="root",  # Tentukan nama pengguna yang ingin Anda ubah kata sandinya. Contoh ini menggunakan root.
    old_password="old_password",  # Masukkan kata sandi lama.
    new_password="new_password",  # Masukkan kata sandi baru.
    using="default"  # Nama database.
)

Riset kata sandi menggunakan UI Attu

  1. Buka halaman Attu. Untuk informasi lebih lanjut, lihat Kelola instans Milvus dengan Attu.

  2. Di panel navigasi di sebelah kiri, klik ikon image.

  3. Pilih pengguna yang ingin Anda modifikasi, dan klik Change Password di kolom Tindakan.

  4. Di kotak dialog, masukkan kata sandi baru, lalu klik Update.

    Setelah kata sandi diubah, sesi Anda akan kedaluwarsa. Klik ikon image untuk keluar, lalu masuk kembali dengan kata sandi baru.

Kontrol akses

Mengapa saya tidak bisa mengakses instans Milvus saya?

Jika Anda tidak dapat mengakses instans Milvus Anda, ikuti langkah-langkah berikut untuk memecahkan masalah dan menyelesaikan masalah:

  1. Periksa konektivitas jaringan.

    Dari baris perintah Anda, jalankan perintah berikut untuk memeriksa koneksi jaringan ke instans Milvus Anda. Ganti c-xxxx.milvus.aliyuncs.com dengan nama domain publik Anda yang sebenarnya.

    telnet c-xxxx.milvus.aliyuncs.com 19530
    • Jika outputnya adalah Connected to c-xxxx.milvus.aliyuncs.com, koneksi jaringan normal.

    • Jika koneksi gagal, pastikan akses Internet diaktifkan dan alamat IP Anda ditambahkan ke daftar putih akses publik instans.

  2. Periksa kompatibilitas Python SDK.

    Setelah Anda memastikan bahwa jaringan terhubung, jalankan pip list di baris perintah lokal Anda untuk memeriksa apakah versi Python SDK Anda memenuhi persyaratan. Jika versi pymilvus Anda lebih awal dari 2.0, tingkatkan dan coba sambungkan lagi.

Penggunaan alat

Bagaimana cara menggunakan Python SDK untuk mengakses instans Milvus?

Instal pustaka PyMilvus secara lokal untuk terhubung ke instans Milvus Anda. Untuk informasi lebih lanjut, lihat Cepat implementasikan pencarian vektor.

Bagaimana cara memberikan izin Milvus kepada Pengguna RAM?

Gunakan akun Anda untuk memberikan izin `AliyunMilvusFullAccess` kepada Pengguna Resource Access Management (RAM). Untuk informasi lebih lanjut, lihat Otorisasi Pengguna RAM.

Apakah Milvus mendukung manajemen grafis?

Ya, mendukung. Milvus mengintegrasikan Attu untuk manajemen yang lebih efisien dari database, koleksi, indeks, dan entitas. Untuk informasi lebih lanjut, lihat Kelola alat dengan Attu.

Bagaimana cara mengakses halaman Manajer Attu?

Aktifkan akses Internet untuk instans dan tambahkan alamat IP publik lokal Anda ke daftar putih. Untuk informasi lebih lanjut, lihat Akses halaman Attu.