PolarSearch adalah mesin pencarian dan analitik data terdistribusi berkinerja tinggi yang dikembangkan oleh PolarDB dan dibangun di atas OpenSearch. PolarSearch kompatibel dengan ekosistem Elasticsearch dan OpenSearch, serta menghilangkan kebutuhan untuk melakukan sinkronisasi data secara manual dari PolarDB ke platform pencarian lainnya. Anda dapat menggunakan API atau SDK untuk menjalankan pencarian teks penuh, pencarian vektor, dan analisis cerdas pada data multimodal—seperti dokumen teks, fitur gambar, dan log—dalam hitungan milidetik.
Dengan PolarSearch, Anda dapat:
Full-text search | Vector search |
Technical architecture
PolarSearch dibangun di atas penyimpanan bersama terdistribusi PolarStore dan arsitektur cloud-native terpisah penyimpanan-komputasi. Mesin ini mengintegrasikan secara mendalam mesin pencarian cerdas proprietary dengan kerangka kerja komputasi terdistribusi, serta mendukung sintaks dan protokol DSL Elasticsearch. PolarSearch menyimpan, menganalisis, dan menjalankan pencarian fusi multi-jalur secara real-time pada data heterogen berskala petabyte, memungkinkan Anda membangun layanan pencarian data yang sangat konkuren dan sangat tersedia dengan cepat sekaligus membuka nilai data Anda.
Product value
Improved efficiency: Menghilangkan kebutuhan untuk mengonfigurasi secara manual tautan sinkronisasi data dari atau PostgreSQL ke mesin pengambilan data. Hal ini mengurangi latensi
workloadpengambilan dari menit menjadi milidetik dan memperpendek siklus pengembangan hingga 50%.Cost optimization: Anda dapat menggantikan arsitektur tradisional multi-mesin dan multi-sistem—seperti yang menggunakan database, penyimpanan file, dan mesin komputasi—dengan PolarSearch. Penyimpanan bersama terdistribusi multi-tier PolarFS mengurangi total biaya kepemilikan (TCO) hingga 40%.
Business innovation: Anda dapat memanfaatkan penyimpanan dan penambangan data tidak terstruktur, pencarian vektor berbasis AI, serta kemampuan lainnya untuk membangun infrastruktur AI, seperti sistem rekomendasi personalisasi, basis pengetahuan Generasi yang Diperkaya dengan Pengambilan Data (RAG), dan penyimpanan memori agen.
Scenarios
E-commerce content platforms and SaaS services
Pencarian fuzzy, pencocokan semantik, dan rekomendasi personalisasi untuk judul produk dan halaman produk.
Analisis kata kunci real-time dan penambangan sentimen untuk ulasan pengguna dan konten yang dihasilkan pengguna (UGC).
Enterprise RAG knowledge bases and document management
Pencarian teks penuh dan pengambilan dokumen untuk file PDF, dokumen Word, dan format lainnya.
Penyimpanan vektorisasi fitur gambar untuk mendukung pencarian gambar serupa.
Agent memory stores and intelligent agent data management
Memori jangka pendek: mencakup konteks percakapan saat ini, konteks sesi, dan variabel sementara.
Memori jangka panjang: menyimpan preferensi pengguna, kueri historis, dan parameter model bahasa besar (LLM)—data dari interaksi berdurasi panjang.
Log analysis and service monitoring
Pencarian real-time, agregasi, dan peringatan anomali untuk data log berskala petabyte.
Analisis asosiasi lintas banyak field log dan pembuatan laporan visualisasi.
Internet of Things (IoT) and real-time IoT data streams
Penulisan berkonkurensi tinggi dan pengambilan cepat data deret waktu perangkat IoT.
Filtering multi-kondisi dan agregasi dinamis aliran data sensor.
Core features
High availability and scalability
Arsitektur terdistribusi menyediakan load balancing otomatis. Jika suatu node gagal, failover berlangsung mulus. Ketersediaan layanan mencapai 99,99%.
Layanan ini mendukung skalabilitas dinamis online. Anda dapat menskalakan sumber daya penyimpanan dan komputasi sesuai permintaan untuk menangani volume data hingga ratusan juta.
Intelligent search engine
PolarSearch membangun indeks sekunder terbalik pada tabel utama InnoDB di node RW PolarDB dan mendukung visibilitas tingkat transaksi.
PolarSearch menggunakan pengoptimal untuk mengidentifikasi permintaan pencarian teks penuh pada tabel utama InnoDB dan secara otomatis meneruskannya ke node pencarian.
PolarSearch mendukung pengindeksan hibrida lintas banyak dimensi—seperti tokenisasi teks, penyematan semantik, dan rentang numerik—untuk meningkatkan kinerja kueri hingga 10 kali lipat atau lebih.
Model peningkatan NLP bawaan untuk bahasa Tionghoa mendukung ekspansi sinonim, koreksi pinyin, dan pengenalan maksud.
Multimodal data fusion
PolarSearch menyimpan indeks maju skalar, indeks terbalik teks penuh, vektor, dan tipe data lainnya dalam satu sistem tunggal serta mendukung pencarian fusi multi-jalur.
PolarSearch menyediakan plugin untuk menyimpan, mengekstraksi, dan mengurai data tidak terstruktur heterogen berskala besar, seperti gambar dan dokumen.
Real-time search and aggregation and analysis
Data dapat dicari dalam ratusan milidetik setelah ingest. PolarSearch mendukung filtering kompleks, bucketing, dan pengurutan Top-K.
Fungsi bawaan mencakup perhitungan jendela bergulir untuk data deret waktu dan pemeriksaan geofence untuk data berbasis lokasi.