全部产品
Search
文档中心

Object Storage Service:Cari objek berdasarkan metadata dan konten semantik

更新时间:Jul 06, 2025

Anda dapat membuat indeks data dan menggunakan metadata serta konten semantik dari objek sebagai kondisi indeks untuk dengan cepat mencari gambar, video, dokumen, dan file audio di Object Storage Service (OSS).

Mengapa menggunakan pengindeksan data?

Metode pencarian file tradisional memiliki keterbatasan signifikan yang secara efektif diatasi oleh Pengindeksan Data OSS:

Pencarian Tradisional

Pengindeksan Data OSS

Operasi Kompleks: Memerlukan penggunaan ListObject untuk melintasi data dan mengekstrak metadata guna membangun database kustom, menghasilkan alur kerja yang rumit dan memakan waktu.

Operasi Sederhana: Menghilangkan kebutuhan migrasi data atau sistem pencarian kustom dengan menyediakan penyaringan dan statistik langsung melalui indeks OSS yang dibangun secara otomatis.

Kinerja Pencarian Rendah: Lambat dan tidak efisien saat menangani data dalam jumlah besar.

Pencarian Berkinerja Tinggi: Mendukung pengindeksan dan agregasi tingkat detik, diskalakan hingga perpustakaan indeks multi-miliar file.

Kemampuan Pencarian Terbatas: Hanya mendukung pencarian berbasis metadata OSS.

Dukungan Multi-modal: Memenuhi berbagai persyaratan melalui metode canggih seperti semantik konten dan karakterisasi file.

Metode pengindeksan data yang didukung

OSS mendukung MetaSearch dan AISearch. Tabel berikut menjelaskan metode pengindeksan data sebelumnya.

Item

MetaSearch

AISearch

Deskripsi

Cari objek tertentu berdasarkan atribut metadata, seperti metadata objek, ETags, dan tag.

Cari objek tertentu berdasarkan informasi tentang dokumen, gambar, video, dan file audio. Anda dapat menentukan konten semantik sebagai kondisi indeks, dan OSS membandingkan konten semantik dengan objek di OSS.

Skenario

Permintaan objek dan statistik

Pencarian multimodal dan pencarian objek kompleks

Contoh kondisi indeks

Cari objek Standar yang daftar kontrol akses (ACL) -nya bersifat pribadi dan yang diunggah pada 14 September 2024

query.png

Cari gambar terkait dengan konten semantik "apel"

apple.png

Contoh hasil

Kembalikan objek Standar yang ACL-nya bersifat pribadi dan yang diunggah pada 14 September 2024

标量检索.png

Kembalikan gambar terkait dengan konten semantik "apel"

向量检索.png

Petunjuk memilih metode pengindeksan data

Perbandingan kondisi pencarian

Kondisi pencarian

MetaSearch

AISearch

Metadata OSS

Tag objek dan ETags

Metadata pengguna

Metadata multimedia

Konten semantik

Skenario tipikal

  • Analitik Optimasi Biaya Identifikasi data non-kritis atau dingin menggunakan metadata OSS seperti cap waktu untuk mengurangi biaya penyimpanan.

    MetaSearch direkomendasikan.

  • Validasi Data Verifikasi hasil pembersihan data dengan membandingkan metrik seperti jumlah data dan ukuran file melalui metadata OSS setelah pemrosesan atau pembersihan data.

    MetaSearch direkomendasikan.

  • Audit Data Lakukan statistik mendalam dan audit untuk konten file dengan mengintegrasikan metadata OSS dengan semantik vektor untuk memenuhi persyaratan kepatuhan.

    Pencarian Vektor direkomendasikan.

  • Pencarian Multi-modal Lakukan pencarian berdasarkan data multimedia dan semantik vektor untuk skenario pencarian tingkat lanjut, seperti pencarian dalam riwayat obrolan, aset media, dan semantik.

    Pencarian Vektor direkomendasikan.

Proses

Gambar berikut menunjukkan cara kerja MetaSearch dan AISearch.

Cara kerja MetaSearch

Gambar berikut menunjukkan cara menggunakan MetaSearch untuk mencari objek berdasarkan atribut metadata.

  1. Unggah file, seperti gambar, video, dokumen, dan file audio, dari aplikasi ke Bucket OSS.

  2. Gunakan pengguna RAM dengan izin untuk mengelola OSS guna mengaktifkan pengindeksan data untuk bucket dan pilih MetaSearch.

  3. OSS menggunakan struktur tabel indeks default untuk secara otomatis membuat indeks data yang berisi metadata OSS, ETags objek, dan tag objek.

  4. Aplikasi memanggil operasi DoMetaQuery untuk mencari objek berdasarkan atribut metadata.

  5. OSS mengembalikan objek yang memenuhi kondisi pencarian.

Cara kerja AISearch

Gambar berikut menunjukkan cara menggunakan AISearch untuk mencari objek berdasarkan atribut metadata dan konten semantik.

  1. Unggah file, seperti gambar, video, dokumen, dan file audio, dari aplikasi ke Bucket OSS.

  2. Gunakan pengguna RAM dengan izin untuk mengelola OSS guna mengaktifkan pengindeksan data untuk bucket dan pilih AISearch.

  3. OSS menggunakan struktur tabel indeks default dan model Embedding untuk secara otomatis membuat indeks data yang berisi metadata OSS, ETags objek, tag objek, metadata pengguna, metadata multimedia, dan konten semantik.

  4. Aplikasi memanggil operasi DoMetaQuery untuk mencari objek berdasarkan atribut metadata dan konten semantik.

  5. OSS mengembalikan objek yang memenuhi kondisi pencarian.

Mulai

Untuk informasi lebih lanjut tentang cara menggunakan MetaSearch dan AISearch, lihat:

Untuk instruksi lebih lanjut dalam berbagai kasus penggunaan, lihat:

Referensi

Untuk detail performa metode pengindeksan yang berbeda, lihat: