Alibaba Cloud menggunakan berbagai data korpus untuk melatih model pengenalan suara yang mencakup skenario umum, pendidikan, hukum, dan kesehatan. Berdasarkan pelatihan korpus ini, Alibaba Cloud menyediakan model dengan akurasi tinggi untuk setiap skenario tersebut. Jika Anda tidak menemukan model standar yang sesuai untuk kebutuhan pengenalan suara Anda, atau jika Anda ingin mengoptimalkan lebih lanjut model standar yang ada, Anda dapat memanfaatkan platform pembelajaran mandiri.
Dengan platform pembelajaran mandiri, Anda dapat mengunggah file korpus pelatihan .txt melalui antarmuka konsol untuk melatih model linguistik dasar yang dipilih sesuai dengan skenario Anda. Pendekatan ini secara efektif meningkatkan akurasi pengenalan suara, terutama untuk kata benda spesifik dan kata-kata frekuensi tinggi dalam skenario Anda.
Perbandingan antara dua metode yang digunakan untuk membuat model linguistik kustom
Jika Anda menggunakan konsol Intelligent Speech Interaction, klik Switch Scene di bawah proyek Anda, pilih skenario yang sesuai, lalu tambahkan model linguistik kustom. Setelah model diterbitkan, model tersebut akan otomatis terhubung dengan appkey proyek Anda tanpa perlu menentukan model linguistik kustom dalam kode.
Jika Anda menggunakan platform terbuka pctowap Alibaba Cloud (POP) API untuk membuat model linguistik kustom, Anda harus memanggil metode SDK yang relevan untuk menentukan ID model dalam kode sebelum model tersebut dapat digunakan.
Catatan tentang korpus pelatihan
Batasan panggilan
Data korpus pelatihan harus relevan dengan bidang bisnis spesifik Anda. Semakin mirip pengucapan data korpus dengan data suara yang akan dikenali, semakin tinggi akurasi pengenalan suara.
File korpus pelatihan yang diunggah harus berupa file .txt yang dikodekan dalam
UTF-8 tanpa byte order mark (BOM). Ukuran maksimum setiap file adalah 10 MB.Setiap kalimat atau kata kunci yang disesuaikan harus menempati satu baris. Panjang maksimal setiap baris adalah 500 karakter.
Angka dalam file korpus pelatihan .txt harus dieja. Contohnya, tulis 58,9 dolar sebagai lima puluh delapan koma sembilan dolar.
Setiap file korpus pelatihan .txt harus berisi minimal satu kalimat dengan lebih dari 4 kata.
Karakter khusus tidak diperbolehkan, kecuali tanda koma (,), titik (.), tanda tanya (?), dan tanda seru (!). Tanda baca harus ditambahkan di akhir setiap kalimat.
Saran optimasi
Salin kata kunci yang sulit dikenali atau kalimat yang mengandung kata kunci tersebut beberapa kali, misalnya 10 baris. Pastikan setiap kata kunci menempati satu baris dalam korpus pelatihan. Jika hasil pengenalan masih belum memuaskan, ulangi kata kunci atau kalimat sesuai kebutuhan.
Jika hasil pengenalan tidak sesuai harapan, periksa apakah masalah disebabkan oleh pengucapan yang tidak jelas atau kualitas audio yang buruk. Jika masalah tetap ada setelah optimasi pengucapan atau kualitas audio, modifikasi korpus pelatihan disarankan.
Tentukan korpus pelatihan akhir setelah menguji performa model linguistik kustom Anda untuk menghindari cacat pengenalan pada data suara yang mengandung homofon.
Contoh
Unduh korpus pelatihan sampel. Korpus pelatihan berikut adalah contoh pengenalan Grup Alibaba:
Pada September 1999, delapan belas pendiri dengan Jack Ma sebagai pemimpin mendirikan Alibaba Group di sebuah apartemen di Hangzhou. Situs web pertama Alibaba Group adalah Alibaba.com, situs web berbahasa Inggris yang fokus pada pasar perdagangan grosir global.
Pada tahun yang sama, Alibaba Group meluncurkan situs web berbahasa Cina yang fokus pada pasar perdagangan grosir di Cina.
Pada Oktober 1999, Alibaba Group mengumpulkan dana sebesar USD 5 juta dari beberapa lembaga investasi.
Pada Oktober 1999, Alibaba Group mengumpulkan dana sebesar USD 5 juta dari beberapa lembaga investasi.
Pada Januari 2000, Alibaba Group mengumpulkan dana sebesar USD 20 juta dari beberapa lembaga investasi termasuk SoftBank.
Pada Januari 2000, Alibaba Group mengumpulkan dana sebesar USD 20 juta dari beberapa lembaga investasi termasuk SoftBank.
Pada September 2000, Alibaba Group mengadakan Konferensi Keamanan Siber Danau Barat pertama. Pemimpin komersial dan opini industri Internet berkumpul dan membahas isu-isu utama industri tersebut.Dalam korpus pelatihan, kalimat yang mengandung kata kunci bisnis seperti "dana" dan "Internet" dapat diulang beberapa kali.
Untuk menggunakan korpus pelatihan, ikuti langkah-langkah berikut:
Pilih model dasar: Pada contoh ini, pilih model umum. Anda dapat memilih model berdasarkan skenario bisnis Anda.
Kumpulkan korpus pelatihan: Simpan korpus pelatihan yang diunduh sebagai file .txt. Jika Anda menyesuaikan korpus pelatihan, pisahkan korpus menjadi kalimat-kalimat terpisah berdasarkan tanda baca. Tulis setiap kalimat dalam baris terpisah.
Latih dan terapkan model yang dipilih: Unggah korpus pelatihan dan latih model yang dipilih menggunakan platform pembelajaran mandiri. Model yang dilatih akan secara efektif mengenali kosakata dalam korpus pelatihan untuk menghasilkan hasil pengenalan yang diinginkan.