LLMRoute adalah Kubernetes CRD yang disesuaikan, disediakan oleh Alibaba Cloud Service Mesh (ASM), dirancang untuk memberikan kemampuan konfigurasi deklaratif bagi aturan routing terkait Large Language Models (LLM). CRD ini mendukung pencocokan trafik berdasarkan kondisi seperti header permintaan dan tag sumber daya, serta dapat secara fleksibel merutekan trafik ke layanan LLM eksternal atau pool inferensi dalam klaster. Topik ini menjelaskan bidang-bidang dari sumber daya LLMRoute.
Konfigurasi contoh
Berikut adalah contoh konfigurasi LLMRoute. Untuk contoh lengkap, lihat Pengaturan Rute Trafik: Gunakan ASM untuk Mengelola Trafik LLM.
apiVersion: istio.alibabacloud.com/v1beta1
kind: LLMRoute
metadata:
name: dashscope-route
spec:
host: dashscope.aliyuncs.com # Harus unik antara penyedia LLM yang berbeda
rules:
- name: vip-route
matches:
- headers:
user-type:
exact: subscriber # Item rute khusus untuk pelanggan langganan
backendRefs:
- providerHost: dashscope.aliyuncs.com
- backendRefs:
- providerHost: dashscope.aliyuncs.comItem konfigurasi
LLMRoute
Item konfigurasi | Tipe | Deskripsi |
host |
| URL tujuan host dari rute. |
gateways |
| Aturan gateway, sama seperti |
rules |
| Daftar aturan routing. |
LLMRule
LLMRule digunakan untuk menentukan satu aturan routing.
Item konfigurasi | Tipe | Deskripsi |
name |
| Nama aturan. |
matches |
| Kondisi kecocokan. |
backendRefs |
| Daftar referensi backend. |
LLMRequestMatch
LLMRequestMatch menentukan kondisi yang harus dipenuhi oleh permintaan.
Item konfigurasi | Tipe | Deskripsi |
Headers |
| Header permintaan yang harus cocok dengan permintaan. |
SourceLabels |
| Label sumber daya yang harus cocok dengan permintaan. |
Gateways |
| Aturan gateway yang harus cocok dengan permintaan. |
LLMBackendRef
LLMBackendRef menentukan informasi yang direferensikan oleh objek backend, termasuk bidang-bidang berikut:
Item konfigurasi | Tipe | Deskripsi |
ProviderHost |
| Host target. |
Weight |
| Nilai bobot. |
BackendRef |
| Referensi objek backend. |
ProviderHost dan BackendRef tidak dapat ada secara bersamaan.
BackendObjectReference
BackendObjectReference menentukan informasi referensi objek backend, termasuk bidang-bidang berikut:
Item konfigurasi | Tipe | Deskripsi |
Group |
| Grup tempat objek backend berada. |
Kind |
| Jenis objek backend. |
Name |
| Nama objek backend. |
Namespace |
| Namespace objek backend. |
Port |
| Port objek backend. |
Saat ini, hanya InferencePool yang dapat direferensikan.