Anda dapat membuat indeks data dan menggunakan metadata serta konten semantik dari objek sebagai kondisi indeks untuk dengan cepat mencari gambar, video, dokumen, dan file audio di Object Storage Service (OSS).
Mengapa menggunakan pengindeksan data?
Metode pencarian file tradisional memiliki keterbatasan signifikan yang secara efektif diatasi oleh Pengindeksan Data OSS:
Pencarian Tradisional | Pengindeksan Data OSS |
Operasi Kompleks: Memerlukan penggunaan ListObject untuk melintasi data dan mengekstrak metadata guna membangun database kustom, menghasilkan alur kerja yang rumit dan memakan waktu. | Operasi Sederhana: Menghilangkan kebutuhan migrasi data atau sistem pencarian kustom dengan menyediakan penyaringan dan statistik langsung melalui indeks OSS yang dibangun secara otomatis. |
Kinerja Pencarian Rendah: Lambat dan tidak efisien saat menangani data dalam jumlah besar. | Pencarian Berkinerja Tinggi: Mendukung pengindeksan dan agregasi tingkat detik, diskalakan hingga perpustakaan indeks multi-miliar file. |
Kemampuan Pencarian Terbatas: Hanya mendukung pencarian berbasis metadata OSS. | Dukungan Multi-modal: Memenuhi berbagai persyaratan melalui metode canggih seperti semantik konten dan karakterisasi file. |
Metode pengindeksan data yang didukung
OSS mendukung MetaSearch dan AISearch. Tabel berikut menjelaskan metode pengindeksan data sebelumnya.
Item | MetaSearch | AISearch |
Deskripsi | Cari objek tertentu berdasarkan atribut metadata, seperti metadata objek, ETags, dan tag. | Cari objek tertentu berdasarkan informasi tentang dokumen, gambar, video, dan file audio. Anda dapat menentukan konten semantik sebagai kondisi indeks, dan OSS membandingkan konten semantik dengan objek di OSS. |
Skenario | Permintaan objek dan statistik | Pencarian multimodal dan pencarian objek kompleks |
Contoh kondisi indeks | Cari objek Standar yang daftar kontrol akses (ACL) -nya bersifat pribadi dan yang diunggah pada 14 September 2024
| Cari gambar terkait dengan konten semantik "apel"
|
Contoh hasil | Kembalikan objek Standar yang ACL-nya bersifat pribadi dan yang diunggah pada 14 September 2024
| Kembalikan gambar terkait dengan konten semantik "apel"
|
Petunjuk memilih metode pengindeksan data
Perbandingan kondisi pencarian
Kondisi pencarian | MetaSearch | AISearch |
Metadata OSS | ✅ | ✅ |
Tag objek dan ETags | ✅ | ✅ |
Metadata pengguna | ❌ | ✅ |
Metadata multimedia | ❌ | ✅ |
Konten semantik | ❌ | ✅ |
Untuk informasi lebih lanjut tentang bidang dan operator yang didukung oleh MetaSearch, lihat Lampiran: Bidang dan Operator yang Didukung dalam Pencarian Skalar.
Untuk informasi lebih lanjut tentang bidang dan operator yang didukung oleh AISearch, lihat Lampiran: Bidang dan Operator yang Didukung oleh AISearch.
Skenario tipikal
Analitik Optimasi Biaya Identifikasi data non-kritis atau dingin menggunakan metadata OSS seperti cap waktu untuk mengurangi biaya penyimpanan.
MetaSearch direkomendasikan.
Validasi Data Verifikasi hasil pembersihan data dengan membandingkan metrik seperti jumlah data dan ukuran file melalui metadata OSS setelah pemrosesan atau pembersihan data.
MetaSearch direkomendasikan.
Audit Data Lakukan statistik mendalam dan audit untuk konten file dengan mengintegrasikan metadata OSS dengan semantik vektor untuk memenuhi persyaratan kepatuhan.
Pencarian Vektor direkomendasikan.
Pencarian Multi-modal Lakukan pencarian berdasarkan data multimedia dan semantik vektor untuk skenario pencarian tingkat lanjut, seperti pencarian dalam riwayat obrolan, aset media, dan semantik.
Pencarian Vektor direkomendasikan.
Proses
Gambar berikut menunjukkan cara kerja MetaSearch dan AISearch.
Cara kerja MetaSearch
Gambar berikut menunjukkan cara menggunakan MetaSearch untuk mencari objek berdasarkan atribut metadata.
Unggah file, seperti gambar, video, dokumen, dan file audio, dari aplikasi ke Bucket OSS.
Gunakan pengguna RAM dengan izin untuk mengelola OSS guna mengaktifkan pengindeksan data untuk bucket dan pilih MetaSearch.
OSS menggunakan struktur tabel indeks default untuk secara otomatis membuat indeks data yang berisi metadata OSS, ETags objek, dan tag objek.
Aplikasi memanggil operasi DoMetaQuery untuk mencari objek berdasarkan atribut metadata.
OSS mengembalikan objek yang memenuhi kondisi pencarian.
Cara kerja AISearch
Gambar berikut menunjukkan cara menggunakan AISearch untuk mencari objek berdasarkan atribut metadata dan konten semantik.
Unggah file, seperti gambar, video, dokumen, dan file audio, dari aplikasi ke Bucket OSS.
Gunakan pengguna RAM dengan izin untuk mengelola OSS guna mengaktifkan pengindeksan data untuk bucket dan pilih AISearch.
OSS menggunakan struktur tabel indeks default dan model Embedding untuk secara otomatis membuat indeks data yang berisi metadata OSS, ETags objek, tag objek, metadata pengguna, metadata multimedia, dan konten semantik.
Aplikasi memanggil operasi DoMetaQuery untuk mencari objek berdasarkan atribut metadata dan konten semantik.
OSS mengembalikan objek yang memenuhi kondisi pencarian.
Mulai
Untuk informasi lebih lanjut tentang cara menggunakan MetaSearch dan AISearch, lihat:
Gunakan MetaSearch untuk Mencari Objek OSS Berdasarkan Atribut Metadata
Gunakan AISearch untuk Cepat Mencari Objek Berdasarkan Konten Semantik dan Metadata Multimedia
Untuk instruksi lebih lanjut dalam berbagai kasus penggunaan, lihat:
Skenario Statis: Tutorial: Gunakan Pengindeksan Data untuk Mencari Objek yang Memenuhi Kondisi Tertentu dalam Volume Data Besar
Pencarian Multimodal: Tutorial: Gunakan Pengindeksan Data untuk Mencari Data Multimodal
Skenario AI: Contoh Tutorial: Membangun Sistem Pengambilan Semantik Cerdas untuk Kamera IP
Referensi
Untuk detail performa metode pengindeksan yang berbeda, lihat:



