Kemampuan analisis multimedia dan mulai - Platform For AI

Analisis multimedia menyediakan layanan berbasis algoritma untuk menganalisis konten multimedia, mencakup layanan model dasar dan layanan model advanced yang menawarkan kemampuan algoritma siap pakai. Topik ini menjelaskan detail penagihan dan petunjuk penggunaan Analisis multimedia.

Informasi latar belakang

Analisis multimedia mendukung layanan algoritma berikut:

Layanan model dasar: Menyediakan kemampuan algoritma siap pakai untuk citra, mencakup pelabelan citra multi-label, penilaian kualitas citra, analisis atribut wajah (seperti daya tarik, bentuk wajah, gaya rambut, dan warna rambut), analisis usia, modifikasi figur (pelangsingan atau pembesaran), serta penghapusan Watermark.
Layanan model advanced: Menyediakan kemampuan algoritma siap pakai untuk video, mencakup klasifikasi dan pelabelan video, penilaian kualitas video, klasifikasi dan pelabelan dinamis untuk unggahan yang berisi citra dan video (digunakan untuk melabeli konten multimodal seperti unggahan dinamis dan thread), serta pelabelan citra yang dihasilkan AI. Label tersebut meningkatkan pelatihan model generasi citra AI.

Detail penagihan

Analisis multimedia mendukung dua metode penagihan: bayar sesuai penggunaan dan paket sumber daya langganan. Untuk informasi selengkapnya, lihat Detail penagihan untuk analisis multimedia.

Panduan penggunaan

Aktifkan analisis multimedia dan beli paket sumber daya

Pengguna baru harus mengaktifkan layanan di bagian Analisis Multimedia, yang berada di bawah Solutions pada halaman Platform for AI (PAI). Prosedurnya sebagai berikut.

Masuk ke Konsol PAI.
Ikuti petunjuk pada gambar untuk mengaktifkan layanan Multimedia Analysis.
Metode penagihan bayar sesuai penggunaan digunakan secara default. Anda ditagih berdasarkan jumlah panggilan.

Anda juga dapat membeli paket sumber daya dengan pembayaran satu kali untuk harga yang lebih rendah.

Pada tab Basic Model Service di halaman Multimedia Analytics, klik Purchase Resource Plan.
Pada halaman Subscription Model Service, konfigurasikan parameter Quantity, Scenarios, API Calls, dan Duration, lalu klik Buy Now.
Untuk menggunakan layanan Analisis multimedia, atur parameter Scenarios ke Multimedia Analysis-Basic Model Service atau Multimedia Analysis-Advanced Model Service. Konfigurasikan parameter lainnya sesuai kebutuhan bisnis Anda.

Petunjuk SDK Python

Setelah mengaktifkan layanan Analisis multimedia, Anda dapat menggunakan kit pengembangan perangkat lunak (SDK) Python untuk memanggil berbagai layanan algoritma. Untuk informasi selengkapnya, lihat Analisis multimedia: Petunjuk SDK Python.

Petunjuk SDK Java

Setelah mengaktifkan layanan Analisis multimedia, lihat Java SDK GitHub untuk detail penggunaan SDK Java dalam memanggil Operasi API layanan algoritma. Parameter untuk SDK Java hampir identik dengan parameter untuk SDK Python. Untuk detail parameter, lihat Analisis multimedia: Petunjuk SDK Python.

Matriks kemampuan analisis multimedia

Spesifikasi	Nama layanan model	Konsumsi per panggilan layanan	Deskripsi	Contoh
Layanan model dasar	Penilaian kualitas citra	1 panggilan layanan model dasar	Memberikan penilaian kualitas citra dan mengembalikan skor bilangan pecahan dari 0 hingga 100.	`"iqa_result":66.88`
	Analisis atribut wajah	1 panggilan layanan model dasar	Memberikan output untuk atribut wajah, termasuk bentuk wajah, warna rambut, gaya rambut, dan daya tarik. Membedakan beberapa wajah berdasarkan koordinat area wajah. Jika tidak ada wajah yang terdeteksi, array kosong dikembalikan.	Bentuk wajah: Triangle, Round, Heart, Square, Oval, Diamond, Long. Gaya rambut wanita: Jenis poni: Center-parted, Braided, Side-swept, No bangs, Wispy, Blunt. Jenis ikal: Cloud curls, Large waves, Small waves, Airy curls, Permed curls, Frizzy curls, Egg-roll curls. Gaya rambut: Curly, Updo, Straight, Ponytail, Braided. Panjang rambut: Medium, Short, Long. Gaya rambut pria: Parted, Buzz cut, Crew cut, Flat top, Butch cut, Textured crop, Layered, Slicked back. Warna rambut: Black, Coffee, Ash gray, Chestnut, Brown, Gradient, Burgundy, Gold, Yellow, Other. Daya tarik: 0 hingga 5.
	Analisis usia	1 panggilan layanan model dasar	Mendeteksi rentang usia wajah utama dalam citra. Jika terdapat beberapa wajah dalam citra, hanya hasil untuk wajah terbesar yang dikembalikan. Jika tidak ada wajah yang terdeteksi, kesalahan dikembalikan.	Rentang usia mencakup: `'0-2'`, `'3-9'`, `'10-19'`, `'20-29'`, `'30-39'`, `'40-49'`, `'50-59'`, `'60-69'`, dan `'70+'`.
	Pelabelan citra multi-label	1 panggilan layanan model dasar	Menyediakan pelabelan citra multi-label. Dapat menghasilkan K tag teratas dengan probabilitas tertinggi beserta fitur berdimensi tinggi yang sesuai.	Contoh tag umum: girl, selfie, boy, daily life, screenshot, food, car, cuisine, game, cartoon, animal, Korean fashion.
	Modifikasi figur	1 panggilan layanan model dasar	Menyediakan fitur modifikasi figur. Anda dapat mengunggah potret dan menyesuaikan figur dengan mengubah parameter degree. Ini mencakup membuat figur lebih langsing atau lebih besar. Nilai `degree > 0` menunjukkan pelangsingan.	Operasi API mengembalikan encoding Base64 dari citra yang telah dimodifikasi.
	Penghapusan Watermark	1 panggilan layanan model dasar	Menghapus Watermark dari citra.	Operasi API mengembalikan encoding Base64 dari citra setelah Watermark dihapus.
	Pelabelan citra yang dihasilkan AI	1 panggilan layanan model dasar	Menyediakan kemampuan pelabelan citra multi-label untuk pelatihan model generasi citra AI, seperti Stable Diffusion. Label yang lebih baik meningkatkan kualitas citra yang dihasilkan.	Model pelabelan yang didukung: WD14, BLIP, GIT, RAM. Contoh hasil caption: `"sensitive, 1girl, solo, long hair, looking at viewer, smile, black hair, brown eyes, scarf, lips, realistic"`.
	Layanan model kustom	N panggilan layanan model dasar. Nilai N bervariasi tergantung pada kompleksitas model kustom.	Menyediakan layanan model kustom untuk citra dan video.	Tergantung pada jenis spesifik model kustom.
Layanan model advanced	Klasifikasi dan pelabelan dinamis untuk unggahan berisi citra dan video	1 panggilan layanan model advanced	Menyediakan klasifikasi dan pelabelan untuk unggahan dinamis atau thread yang berisi konten multimodal. Mendukung klasifikasi dan pelabelan menggunakan kombinasi teks dan citra atau teks dan video. Juga mendukung pengembalian penyematan fitur berdimensi tinggi.	Contoh kelas umum: life, movies and TV shows, sports, travel, games, food, fitness. Contoh tag umum: sports, food, dance, fitness, cooking, travel, selfie. Contoh penyematan: `0.915,0.882,0.943,0.978,1.027,1.181,1.066,1.029,0.866,0.716,0.628,1.203,0.689,0.533,0.734,1.038,0.98,0.613,0.96,0.88,0.586,0.702,1.515,0.697,0.987,0.699,1.179,4.274,0.757,0.89,0.805,0.901`.
	Penilaian kualitas video	1 panggilan layanan model advanced	Menyediakan penilaian kualitas video pendek dan mengembalikan skor kualitas bilangan pecahan dari 0 hingga 100.	`"video_score":20.57`
	Klasifikasi dan pelabelan video	1 panggilan layanan model advanced	Menyediakan klasifikasi dan pelabelan video pendek. Mengembalikan kelas video dan K tag teratas dengan probabilitas tertinggi. Juga mendukung pengeluaran fitur video berdimensi tinggi.	Contoh kelas umum: life, knowledge, music, technology, games. Contoh tag umum: with captions, girl, social news, slimming and shaping, skits, movie clips, natural scenery.

Pengujian dan layanan

Untuk pengujian lebih lanjut dan dukungan, hubungi kami dengan mengirimkan Tiket untuk dukungan teknis.