Hologres menyediakan berbagai model AI bawaan untuk aplikasi AI yang beragam. Anda dapat menerapkan model-model ini melalui Konsol Hologres sesuai dengan kebutuhan bisnis Anda. Dokumen ini menjelaskan model AI yang tersedia dan cara menerapkannya.
Model yang Didukung
Model bawaan ini memerlukan Hologres V3.2 atau versi lebih baru.
Nama Model | Kategori | Rekomendasi minimum vCPU untuk penerapan single-replica | Rekomendasi minimum memori untuk penerapan single-replica (GB) | Rekomendasi minimum jumlah GPU untuk penerapan single-replica | Rekomendasi minimum Memori GPU untuk penerapan single-replica (GB) | Versi instans yang diperlukan | Catatan |
Model konversi PDF | 20 | 100 | 1 atau lebih | 48 | V4.0 dan lebih baru | Tidak ada | |
Model multimodal | 7 | 24 | 1 atau lebih | 24 | V4.0 dan lebih baru | Tidak ada | |
Model multimodal | 7 | 30 | 1 atau lebih | 48 | V4.0 dan lebih baru | Tidak ada | |
Model multimodal | 7 | 30 | 1 atau lebih | 96 | V4.0 dan lebih baru | Tidak ada | |
Model penyematan citra | 7 | 24 | 1 | 24 | V4.0 dan lebih baru |
| |
Model penyematan multibahasa untuk citra | 7 | 24 | 1 | 24 | V4.0 dan lebih baru |
| |
Model penyematan citra | 7 | 24 | 1 | 24 | V4.0 dan lebih baru |
| |
Model penyematan citra | 7 | 24 | 1 | 24 | V4.0 dan lebih baru |
| |
LLM | 7 | 30 | 1 atau lebih | 8 | V3.2 dan lebih baru | Tidak ada | |
LLM | 7 | 30 | 1 atau lebih | 16 | V3.2 dan lebih baru | Tidak ada | |
LLM | 7 | 30 | 1 atau lebih | 32 | V3.2 dan lebih baru | Tidak ada | |
LLM | 7 | 30 | 1 atau lebih | 48 | V3.2 dan lebih baru | Tidak ada | |
LLM | 7 | 30 | 1 atau lebih | 96 | V3.2 dan lebih baru | Tidak ada | |
Klasifikasi sentimen | 7 | 30 | 1 | 4 | V3.2 dan lebih baru | Tidak ada | |
Model penyematan teks | 7 | 30 | 1 | 12 | V3.2 dan lebih baru | Dimensi vektor keluaran: 768 | |
Model penyematan teks | 7 | 30 | 1 | 16 | V3.2 dan lebih baru | Dimensi vektor keluaran: 1024 | |
Model penyematan teks | 7 | 30 | 1 | 8 | V3.2 dan lebih baru | Dimensi vektor keluaran: 512 | |
Model penyematan teks | 7 | 30 | 1 | 8 | V3.2 dan lebih baru | Tidak ada | |
Model penyematan teks | 7 | 30 | 1 | 32 | V3.2 dan lebih baru | Tidak ada | |
Model penyematan teks | 7 | 30 | 1 | 48 | V3.2 dan lebih baru | Tidak ada | |
recursive-character-text-splitter | Pemisahan teks | 15 | 30 | 0 | 0 | V3.2 dan lebih baru | Pilih spesifikasi CPU sesuai kebutuhan. Pengaturan jumlah GPU tidak diperlukan. |
Penyematan teks panjang | 7 | 30 | 1 | 12 | V3.2 dan lebih baru | Dimensi vektor keluaran: 768 | |
Penyematan teks panjang | 7 | 30 | 1 | 12 | V3.2 dan lebih baru | Dimensi vektor keluaran: 768 | |
Penyematan teks panjang | 7 | 30 | 1 | 16 | V3.2 dan lebih baru | Dimensi vektor keluaran: 1024 | |
Penyematan teks panjang | 7 | 30 | 1 | 16 | V3.2 dan lebih baru | Dimensi vektor keluaran: 1024 | |
Penyematan teks panjang | 7 | 30 | 1 | 8 | V3.2 dan lebih baru | Dimensi vektor keluaran: 384 | |
Penyematan teks panjang | 7 | 30 | 1 | 8 | V3.2 dan lebih baru | Dimensi vektor keluaran: 512 |
Prasyarat
Anda telah membeli sumber daya AI.
Catatan
Pilih dan terapkan model dari daftar yang tersedia. Setiap model memerlukan sumber daya AI minimum tertentu.
Anda dapat menerapkan beberapa model pada satu instans, asalkan total konsumsi sumber daya tidak melebihi kuota yang telah dibeli. Tingkatkan skala jika sumber daya tidak mencukupi.
Untuk instans utama/sekunder: Penerapan dan manajemen model (memodifikasi sumber daya, menghapus) hanya tersedia untuk instans utama. Instans sekunder dapat melihat model dari instans utama dan memanggilnya melalui fungsi AI.
Menerapkan Model
Masuk ke Konsol Hologres dan pilih wilayah.
Di bilah navigasi kiri, klik Instances. Kemudian, klik ID instans target.
Di halaman Instance Details, klik AI Node.
Di bagian Models, klik Deploy Model.
Di kotak dialog Deploy Model, atur Model Name dan Model Type.
Parameter untuk Resource Configurations akan diisi otomatis berdasarkan Model Type yang dipilih.
Setelah menyelesaikan konfigurasi, klik OK untuk menerapkan model.
Di bagian Models, lihat status penerapan dan lakukan operasi berikut:
Menyesuaikan konfigurasi model: Di kolom Actions model target, klik Adjust Configurations.
Hapus model: Di kolom Actions model target, klik Delete.
CatatanHologres tidak memeriksa layanan dependen saat menghapus model. Berhati-hatilah untuk mencegah waktu henti layanan.
Langkah Selanjutnya
Setelah menerapkan model, Anda dapat memanggilnya melalui fungsi AI. Untuk informasi lebih lanjut, lihat fungsi AI.