Analisis gambar video (EasyVision) - Platform For AI

Platform for AI (PAI) menyediakan EasyVision, kerangka algoritma canggih untuk kecerdasan visual. EasyVision menawarkan berbagai kemampuan pelatihan model dan prediksi. Anda dapat menggunakan EasyVision untuk melatih serta menerapkan model visi komputer (CV) pada aplikasi CV Anda.

Perkembangan pesat teknologi pembelajaran mendalam mendorong pemanfaatan komersial skala besar dalam visi komputer (CV). Sebagai pengembang CV, Anda mungkin menghadapi tantangan berikut saat menggunakan teknologi pembelajaran mendalam untuk membangun model CV:

Biaya tinggi diperlukan untuk mengembangkan dan men-debug algoritma pembelajaran mendalam.
Model sering diperbarui, sehingga Anda harus menghabiskan banyak waktu untuk memahami cara kerja model dan detail lainnya.
Untuk melatih algoritma dan meningkatkan kinerja inferensi, Anda perlu menguasai pengetahuan profesional dan sistematis.
Biaya tinggi diperlukan untuk anotasi data.
Untuk menggunakan algoritma sumber terbuka di PAI, Anda harus menghabiskan waktu untuk mempelajari dan membangun ulang algoritma tersebut.

Untuk mengatasi tantangan di atas, PAI menyediakan EasyVision, sebuah kerangka algoritma yang sederhana dan mudah digunakan untuk melatih model. Anda dapat menggunakan EasyVision untuk membangun dan menerapkan model CV dengan lebih mudah. EasyVision memiliki keunggulan berikut:

Kemudahan Penggunaan
EasyVision mendukung Operasi API yang dapat dicolokkan, yang dapat dipanggil untuk menyelesaikan berbagai tugas dari modul-modul berbeda. Selain itu, EasyVision menyediakan fitur-fitur kaya seperti I/O data, pra-pemrosesan, Pelatihan model, dan prediksi offline untuk mendukung seluruh proses pemodelan. Anda dapat menggunakan EasyVision di beberapa modul seperti Machine Learning Studio atau Data Science Workshop (DSW) dari PAI.
Kinerja Tinggi
EasyVision mengemas berbagai mesin optimasi PAI-TensorFlow, seperti mesin optimasi untuk kompilasi, pelatihan terdistribusi, dan pelatihan presisi campuran. Anda dapat menggunakan mesin optimasi ini untuk meningkatkan kinerja sistem dengan mengonfigurasi file konfigurasi terkait. Anda juga dapat menggunakan EasyVision dalam sistem TensorFlow sumber terbuka.
Model yang Kaya
EasyVision menyediakan berbagai macam model, seperti model pengenalan karakter optik (OCR), yang dilatih berdasarkan dataset sumber terbuka. Hal ini mengurangi biaya pengembangan dan pelatihan.

Arsitektur

EasyVision membangun model zoo dengan banyak model. Selain itu, EasyVision menyediakan berbagai kemampuan pelatihan model dan prediksi serta kompatibel dengan perintah, Video Intelligence Platform (VIP), dan DSW dari PAI. Dengan cara ini, EasyVision dapat memenuhi berbagai kebutuhan pemodelan. EasyVision menggunakan arsitektur pipeline terdistribusi untuk prediksi offline. Arsitektur ini fleksibel dan sangat tersedia, memungkinkan EasyVision memproses ratusan juta catatan data secara offline dalam waktu singkat. Model dapat digunakan untuk membuat prediksi di Elastic Algorithm Service (EAS) dari PAI. Fitur optimasi sistem dan model PAI memungkinkan Anda membuat prediksi dengan parameter lebih sedikit secara lebih efisien. Selain itu, Anda dapat menggunakan EasyVision untuk menyesuaikan operasi pelatihan model dan prediksi, sehingga Anda dapat menggunakan kembali fitur yang ada dan mengoptimalkan model. Gambar berikut menunjukkan arsitektur EasyVision. 更新图

Fitur

Kemudahan Penggunaan
Anda mungkin memiliki persyaratan berbeda untuk pelatihan model dan prediksi. Misalnya, Anda mungkin ingin menyederhanakan operasi pelatihan model, menjalankan tugas pelatihan model dan prediksi sesuai jadwal, serta menggunakan kembali model dan algoritma yang ada. Untuk memenuhi persyaratan ini, EasyVision kompatibel dengan perintah, VIP, dan DSW dari PAI.
Performa Dioptimalkan
EasyVision mengoptimalkan pelatihan terdistribusi berdasarkan PAI-TensorFlow. EasyVision memungkinkan Anda melatih model pada satu atau beberapa server multi-GPU. EasyVision juga meningkatkan kinerja inferensi, termasuk optimasi grafik dan kompresi model.
Koneksi ke Smart Labeling dari PAI
EasyVision terhubung ke Smart Labeling dari PAI, yang digunakan untuk melabeli data. PAI menyediakan alat konversi untuk mengonversi file yang berisi data berlabel menjadi file TFRecord. Anda dapat menggunakan file TFRecord untuk melatih model EasyVision. Selain itu, EasyVision menyediakan modul peningkatan data yang kaya untuk menyuntikkan data secara dinamis selama pelatihan.
Prediksi Offline yang Efisien
EasyVision memungkinkan Anda menggunakan beberapa server untuk membuat prediksi secara bersamaan. Setiap server memproses data secara terpisah. Dengan cara ini, Anda dapat menggunakan data offline untuk membuat prediksi berdasarkan model yang dilatih oleh EasyVision. Setiap pekerjaan pemrosesan dalam tugas prediksi dapat dijalankan secara dipercepat dengan menggunakan beberapa utas pada beberapa server. Semua pekerjaan dijalankan secara asinkron satu per satu, meningkatkan efisiensi pemrosesan. Anda juga dapat menyesuaikan pekerjaan.
Koneksi ke EAS
File SavedModel dihasilkan selama pelatihan. Anda dapat menggunakan file SavedModel di sistem Anda sendiri atau EAS untuk membuat prediksi online. EasyVision menyediakan Prosesor yang mendukung kemampuan prediksi online yang kuat dari EAS. Anda dapat menggunakan Prosesor ini untuk memproses data secara real-time setelah menentukan informasi model seperti Titik akhir dan jenis dalam file konfigurasi.