Topik ini menjelaskan istilah-istilah yang umum digunakan dalam ApsaraVideo VOD, seperti format video, codec, dan transkoding.
Format File
Nama file dalam sistem operasi memiliki akhiran yang merupakan ekstensi nama file, seperti .doc, .jpg, dan .avi. Ekstensi nama file memungkinkan sistem operasi menentukan aplikasi mana yang akan digunakan untuk membuka setiap file. Dengan cara ini, file dapat dikenali dan dibuka oleh aplikasi yang sesuai. Ekstensi nama file umum untuk video termasuk .avi, .mpg, dan .mp4. File video dapat dikaitkan dengan dan diputar oleh pemain video yang diinstal di PC Anda.
Format Kontainer
Format kontainer adalah format file yang memungkinkan aliran video terkompresi, aliran audio, dan metadata dikemas menjadi satu file berdasarkan spesifikasi tertentu. Metadata mencakup informasi dasar tentang video, seperti judul dan subtitle.
Format kontainer digunakan untuk menyimpan atau streaming video.
Format kontainer berikut digunakan untuk menyimpan video: AVI, ASF (WMA atau WMV), MP4, MKV, dan RMVB (RM atau RA).
Format kontainer berikut digunakan untuk streaming video: Flash Video (FLV), Transport Stream (TS), dan MP4. Format TS harus digunakan dengan protokol streaming, seperti HTTP Live Streaming (HLS) dan Real-Time Messaging Protocol (RTMP). Format MP4 harus digunakan dengan protokol HTTP.
Berikut ini menjelaskan format kontainer yang digunakan untuk streaming video berdasarkan protokol streaming:
MP4: format kontainer video klasik yang didukung oleh beberapa klien, termasuk perangkat seluler (iOS dan Android) dan browser web di PC. Namun, header file MP4 memiliki ukuran besar dan struktur yang kompleks. Jika durasi file MP4 panjang, seperti beberapa jam, waktu yang diperlukan untuk memuat video meningkat karena header file yang besar. Oleh karena itu, format MP4 lebih cocok untuk video pendek.
File MP4 terdiri dari kotak (sebelumnya dikenal sebagai atom) yang mencakup semua metadata media, seperti pengaturan media dan informasi waktu. Metadata memberikan referensi ke data media seperti frame video, dan pengaturan data media dalam kotak dijelaskan dalam metadata file utama pertama. Durasi video yang lebih lama menunjukkan header file yang lebih besar, yang meningkatkan waktu yang diperlukan untuk memuat video.
HLS: protokol transmisi jaringan berbasis HTTP untuk streaming media yang dikembangkan oleh Apple Inc. Secara default, protokol ini menggunakan format kontainer TS untuk membagi aliran menjadi beberapa fragmen TS. Protokol ini juga mendefinisikan file indeks M3U8 (file teks) untuk mengontrol pemutaran. HLS membutuhkan waktu yang lebih singkat untuk menyangga data header dan cocok untuk memainkan video sesuai permintaan. HLS didukung pada perangkat seluler (iOS dan Android) tetapi tidak kompatibel dengan Internet Explorer pada PC. Oleh karena itu, HLS memerlukan pemain kustom yang dikembangkan untuk PC. Kami merekomendasikan Anda menggunakan ApsaraVideo Player for Web.
FLV: format standar yang dikembangkan oleh Adobe. Format ini didukung oleh Flash Player di PC, tetapi tidak didukung pada perangkat seluler kecuali aplikasi pemain diinstal. Browser di sebagian besar ponsel seperti iPhone tidak mendukung FLV. Kami merekomendasikan Anda menggunakan ApsaraVideo Player.
Dynamic Adaptive Streaming over HTTP (DASH): standar streaming yang menggunakan format MP4 terfragmentasi (fMP4) untuk membagi video MP4 menjadi beberapa fragmen. Fragmen dapat memiliki pengaturan codec yang berbeda, seperti resolusi dan bitrate. Anda dapat memainkan fragmen yang berbeda untuk menerapkan streaming bitrate adaptif dan beralih mulus antara resolusi yang berbeda. Ini memberikan pengalaman pemutaran yang lebih baik. Dalam DASH, file deskripsi presentasi media (MPD) analog dengan file M3U8 HLS. Banyak situs video seperti YouTube dan Netflix menggunakan DASH untuk streaming konten video.
HLS dengan fMP4: protokol HLS pada dasarnya. Selama Konferensi Pengembang Dunia Apple (WWDC) pada tahun 2016, Apple Inc. mengumumkan bahwa standar HLS baru mendukung format fMP4 dengan cara yang mirip dengan format TS. Ini memungkinkan file video untuk ditranskode dan dikemas dalam format DASH dan HLS secara bersamaan.
HLS termasuk HLS dengan fMP4 dan DASH adalah teknologi streaming adaptif yang paling umum digunakan. Kami merekomendasikan Anda menggunakan HLS dan DASH.
Codec
Codec adalah program atau perangkat yang dapat mengompres atau mendekompresi (atau mendekode) video digital. Dalam banyak kasus, kompresi tersebut adalah kompresi lossy. Codec juga merujuk pada teknologi kompresi yang digunakan untuk mengonversi video dari satu format ke format lain. Bagian berikut menjelaskan codec umum:
H.26X: dikembangkan oleh International Telecommunication Union (ITU). Keluarga ini mencakup H.261, H.262, H.263, H.264, dan H.265.
H.261: digunakan dalam konferensi video dan panggilan video yang lebih awal.
H.262: mendukung pengkodean dan transmisi video definisi standar (SD) dan terutama digunakan di bidang-bidang seperti penyiaran, DVD, dan TV digital.
H.263: digunakan dalam konferensi video, panggilan video, dan video online.
H.264: juga dikenal sebagai MPEG-4 Bagian 10, atau MPEG-4 Advanced Video Coding (MPEG-4 AVC). Ini adalah standar kompresi video dan format yang banyak digunakan untuk merekam, mengompresi, dan menerbitkan video presisi tinggi.
H.265: juga dikenal sebagai High Efficiency Video Coding (HEVC). H.265 adalah standar kompresi video yang merupakan penerus H.264. Dibandingkan dengan H.264, H.265 meningkatkan kualitas video dengan memberikan rasio kompresi dua kali lipat. Ini mengurangi bitrate sebesar 50% tanpa mengorbankan kualitas video. H.265 mendukung resolusi hingga 8192 × 4320, yang merupakan definisi tren.
MPEG: dikembangkan oleh Moving Picture Experts Group (MPEG), sebuah aliansi kelompok kerja yang didirikan oleh International Organization for Standardization (ISO) dan International Electrotechnical Commission (IEC). MPEG mencakup standar kompresi video berikut:
MPEG-1 Bagian 2: digunakan dalam VCD dan beberapa video online. Kualitas video yang disediakan oleh standar ini mirip dengan VHS.
MPEG-2 Bagian 2: setara dengan H.262 dan digunakan dalam DVD, SVCD, dan sebagian besar sistem siaran video digital dan sistem distribusi kabel.
MPEG-4 Bagian 2: digunakan dalam transmisi jaringan, penyiaran, dan penyimpanan media. Standar ini memberikan kinerja kompresi yang lebih baik daripada MPEG-2 dan H.263 V1.
MPEG-4 Bagian 10: memberikan konten teknis yang sama dengan H.264 dari ITU-T. ITU-T dan MPEG bekerja sama untuk mengembangkan standar H.264 atau MPEG-4 AVC. ITU-T menamai standar ini H.264, sementara ISO dan IEC menamainya MPEG-4 AVC.
Audio Video Coding Standard (AVS): serangkaian standar pengkodean audio dan video digital yang dirumuskan oleh Kelompok Kerja Standar Pengkodean Audio Video Tiongkok. Dua generasi standar AVS telah dirumuskan.
Standar AVS generasi pertama mencakup "Teknologi Informasi: Pengkodean Lanjutan Audio dan Video, Bagian 2: Video" (AVS1) dan "Teknologi Informasi: Pengkodean Lanjutan Audio dan Video, Bagian 16: Video Radio Televisi" (AVS+). AVS+ memberikan efisiensi kompresi yang sama dengan H.264 atau MPEG-4 AVC High Profile.
Standar AVS generasi kedua (AVS2) dirancang untuk kompresi efisien video UHD (4K atau lebih tinggi) dan video rentang dinamis tinggi (HDR). Efisiensi kompresi AVS2 dua kali lipat dari AVS+ dan H.264 atau MPEG-4 AVC, dan melampaui H.265 atau HEVC.
Codec lainnya seperti VP8 dan VP9 yang dikembangkan oleh Google dan RealVideo yang diluncurkan oleh RealNetworks jarang digunakan untuk video online.
Sebelum Anda memilih codec, pertimbangkan kompatibilitas codec dengan klien pemutaran seperti aplikasi dan browser web. Kami merekomendasikan Anda menggunakan codec yang paling umum dan didukung secara luas. ApsaraVideo VOD mendukung codec video berikut: H.264 atau MPEG-4 AVC, dan H.265 atau HEVC. H.264 atau MPEG-4 AVC digunakan sebagai codec video default. ApsaraVideo VOD juga mendukung codec audio berikut: MP3, AAC, VORBIS, dan FLAC. MP3 digunakan sebagai codec audio default.
Transcoding
Transcoding video mengacu pada proses mengonversi aliran video terkompresi ke aliran video lain untuk menyesuaikan dengan lebar pita jaringan yang berbeda, kemampuan pemrosesan terminal, dan persyaratan pengguna. Transcoding adalah proses di mana decoding dan encoding dilakukan. Aliran sebelum dan sesudah transcoding dapat menggunakan codec video yang sama atau berbeda.
Konversi Format Kontainer
Konversi format kontainer mengacu pada proses mengonversi aliran audio atau video terkompresi dari satu format kontainer ke format kontainer lain tanpa encoding atau decoding. Misalnya, konversikan video AVI ke MP4. Aliran video dan audio terkompresi diperoleh dari file dalam satu format kontainer dan kemudian dikemas ke dalam file dalam format kontainer lain. Konversi format kontainer menyediakan fitur berikut:
Pemrosesan cepat. Encoding dan decoding file audio dan video kompleks dan memakan sebagian besar waktu transcoding. Konversi format kontainer tidak memerlukan encoding atau decoding. Ini mengurangi waktu pemrosesan.
Kualitas audio atau video tanpa kehilangan. Konversi format kontainer tidak mengompres file audio atau video karena encoding dan decoding tidak terlibat.
Resolusi dan bitrate file yang dikonversi hampir sama dengan file aslinya. Oleh karena itu, file yang dikonversi dianggap diputar dalam kualitas asli.
Bitrate
Bitrate mengacu pada lalu lintas data yang digunakan file video per satuan waktu. Ini adalah item paling penting untuk kontrol kualitas gambar dalam pengkodean video. Bitrate diukur dalam bit per detik (bit/s), dan sering digunakan dalam unit Kbit/s dan Mbit/s. Untuk video dengan resolusi yang sama, bitrate yang lebih tinggi menunjukkan rasio kompresi yang lebih kecil dan kualitas video yang lebih tinggi. Bitrate yang lebih tinggi menunjukkan laju sampling per satuan waktu yang lebih tinggi dan akurasi aliran data yang lebih tinggi. Oleh karena itu, kualitas dan definisi file video yang diproses mendekati file aslinya. File yang diproses memerlukan kemampuan dekoding yang sangat baik dari perangkat pemutaran.
Semakin tinggi bitrate, semakin besar file. Anda dapat menghitung ukuran file berdasarkan rumus berikut: Ukuran file = Waktu × Bitrate/8. Misalnya, jika file video online 720p selama 60 menit memiliki bitrate 1 Mbit/s, ukuran file dihitung berdasarkan rumus berikut: 3.600 detik × 1 Mbit/s/8 = 450 MB.
Resolusi
Resolusi adalah jumlah piksel yang terkandung dalam setiap dimensi. Misalnya, video 1.280 × 720 menunjukkan bahwa lebar video adalah 1.280 piksel dan tingginya adalah 720 piksel. Resolusi video menentukan jumlah detail dalam video Anda. Resolusi video menentukan seberapa realistis dan jelas video terlihat. Video dengan resolusi yang lebih tinggi berisi lebih banyak piksel dan memiliki gambar yang lebih jelas.
Resolusi adalah faktor kunci yang menentukan bitrate. Video dengan resolusi berbeda menggunakan bitrate yang berbeda. Dalam banyak kasus, resolusi yang lebih tinggi memerlukan bitrate yang lebih tinggi. Setiap resolusi sesuai dengan rentang bitrate yang direkomendasikan. Jika Anda menentukan resolusi dan bitrate yang lebih rendah dari batas bawah rentang yang direkomendasikan, kualitas video buruk. Jika Anda menentukan resolusi dan bitrate yang lebih tinggi dari batas atas rentang yang direkomendasikan, video menempati lebih banyak ruang penyimpanan dan memerlukan lebih banyak lalu lintas untuk dimuat, tetapi kualitas video tidak meningkat secara signifikan.
Frame rate
Frame rate digunakan untuk mengukur jumlah frame yang ditampilkan per satuan waktu dalam video, atau jumlah frame yang diperbarui per detik dalam gambar. Satuan frame rate adalah frame per detik (FPS) atau Hz.
Semakin tinggi frame rate, semakin halus dan lebih nyata video terlihat. Dalam banyak kasus, 25 hingga 30 fps sudah cukup. 60 fps dapat memberikan pengalaman pemutaran yang imersif dan realistis. Jika Anda meningkatkan frame rate menjadi lebih dari 75 fps, peningkatan pengalaman pemutaran kurang signifikan. Jika Anda menentukan frame rate lebih tinggi dari laju penyegaran monitor Anda, monitor tidak dapat menampilkan frame dengan benar dan potensi pemrosesan kartu grafis Anda terbuang. Frame rate yang lebih tinggi pada resolusi yang sama memerlukan kemampuan pemrosesan yang lebih besar dari kartu grafis.
GOP
Group of Pictures (GOP) adalah sekelompok gambar berurutan dalam video atau aliran video yang dikodekan MPEG. GOP dimulai dengan I-frame dan berakhir dengan I-frame berikutnya. GOP berisi jenis gambar berikut:
I-frame (intra coded picture): keyframe. I-frame berisi semua informasi yang diperlukan untuk menghasilkan gambar untuk frame tersebut. Ini didekode secara independen dan dapat dianggap sebagai gambar statis. Frame pertama dalam urutan video selalu merupakan I-frame, dan setiap GOP dimulai dengan I-frame.
P-frame (predictive coded picture): P-frame harus dikodekan berdasarkan I-frame sebelumnya. P-frame berisi informasi perbedaan dengan kompensasi gerakan relatif terhadap I-frame atau P-frame sebelumnya. Selama decoding, perbedaan yang didefinisikan oleh P-frame saat ini ditumpangkan dengan gambar yang sebelumnya disimpan untuk menghasilkan gambar akhir. P-frame menempati lebih sedikit bit data dibandingkan dengan I-frame. Namun, P-frame sensitif terhadap kesalahan transmisi karena ketergantungan kompleks pada I-frame atau P-frame sebelumnya.
B-frame (bidirectionally predictive coded picture): B-frame berisi informasi perbedaan dengan kompensasi gerakan relatif terhadap frame sebelumnya dan sesudahnya. Selama decoding, data B-frame saat ini ditumpangkan dengan gambar yang sebelumnya disimpan dan gambar sesudahnya yang telah didekode untuk menghasilkan gambar akhir. B-frame memberikan rasio kompresi yang tinggi dan memerlukan kinerja dekoding yang tinggi.
Nilai GOP menunjukkan interval keyframe, yaitu jarak antara dua Instantaneous Decoding Refresh (IDR) frame atau jumlah maksimum frame dalam grup frame. Setidaknya satu keyframe diperlukan untuk setiap detik video. Lebih banyak keyframe meningkatkan kualitas video tetapi meningkatkan konsumsi bandwidth dan beban jaringan. Interval dihitung dengan membagi nilai GOP (jumlah frame) dengan frame rate. Misalnya, nilai GOP default ApsaraVideo VOD adalah 250 frame dan frame rate adalah 25 FPS. Interval waktu dihitung berdasarkan rumus berikut: 250/25 = 10 detik.
Nilai GOP harus berada dalam rentang yang sesuai untuk mencapai keseimbangan antara kualitas video, ukuran file (konsumsi bandwidth), dan efek pencarian (kecepatan respons terhadap operasi drag dan fast-forward).
Menambah nilai GOP mengurangi ukuran file. Namun, jika nilai GOP terlalu besar, frame terakhir dari GOP terdistorsi, dan kualitas video berkurang.
Nilai GOP juga merupakan faktor kunci dalam menentukan kecepatan respons terhadap pencarian dalam video. Selama pencarian, pemain menemukan keyframe terdekat sebelum posisi yang ditentukan. Nilai GOP yang lebih besar menunjukkan jarak yang lebih panjang antara posisi yang ditentukan dan keyframe terdekat, yang menghasilkan lebih banyak frame prediktif yang perlu didekode. Dalam hal ini, waktu pemuatan diperpanjang dan operasi pencarian memerlukan waktu lama untuk diselesaikan.
Encoding P-frame dan B-frame lebih kompleks dibandingkan dengan encoding I-frame. Nilai GOP yang besar menghasilkan banyak P-frame dan B-frame. Ini menurunkan efisiensi encoding.
Namun, jika nilai GOP terlalu kecil, bitrate video harus ditingkatkan untuk memastikan kualitas gambar tidak berkurang. Proses ini meningkatkan konsumsi bandwidth.
Mode Pemindaian
Pemindaian progresif: Semua baris setiap frame digambar secara berurutan untuk mengisi layar.
Pemindaian interlaced: Baris pemindaian genap digambar di layar dan kemudian baris pemindaian ganjil digambar di layar. Dua bidang baris pemindaian genap dan ganjil ini membentuk satu frame video.
Penyelarasan Frame IDR
Frame IDR adalah jenis khusus dari I-frame. P-frame dan B-frame setelah I-frame normal dapat merujuk ke I-frame lain sebelum frame IDR. Namun, tidak ada frame setelah frame IDR yang dapat merujuk ke frame lain sebelum frame IDR. Untuk mengontrol proses encoding dan decoding, I-frame pertama dari urutan frame ditentukan sebagai frame IDR.
Frame IDR memberi tahu codec untuk segera menyegarkan buffer frame referensi. Dengan cara ini, kesalahan dalam frame sebelum frame IDR tidak menyebar ke frame setelah frame IDR. Frame IDR dan frame setelahnya dikodekan sebagai urutan baru. Frame IDR juga dapat digunakan untuk akses acak, I-frame normal tidak mendukung akses acak. Sebagian besar pemain memungkinkan pengguna untuk mencari (seret slider) ke posisi tertentu pada bilah kemajuan. Dalam hal ini, metode pemutaran paling efisien adalah memainkan video dari frame IDR terdekat dengan posisi yang ditentukan. Ini mencegah parsing balik yang rumit karena semua frame setelah frame IDR tidak merujuk ke I-frame lain sebelumnya.
Saat Anda mentranskode video ke beberapa video dalam bitrate berbeda, Anda dapat mengaktifkan penyelarasan frame IDR. Dengan cara ini, frame IDR dari semua video output diselaraskan secara akurat berdasarkan waktu dan konten frame. Kemudian, pemain dapat beralih mulus di antara video dalam bitrate berbeda tanpa lag yang jelas.
Profil
Profil mendefinisikan serangkaian kemampuan yang berfokus pada kelas aplikasi tertentu. H.264 menyediakan profil berikut:
Baseline Profile: menggunakan I-frame dan P-frame dan hanya mendukung video progresif dan context-adaptive variable-length coding (CAVLC). Profil ini digunakan dalam aplikasi low-end atau aplikasi yang memerlukan toleransi kesalahan tambahan, seperti aplikasi pesan instan yang mendukung panggilan video di perangkat seluler.
Main Profile: menggunakan I-frame, P-frame, dan B-frame, dan mendukung video progresif dan interlaced. Ini juga mendukung CAVLC dan context-adaptive binary arithmetic coding (CABAC). Profil ini digunakan dalam produk elektronik konsumen arus utama, seperti pemain MP4, pemain video portabel, PSP, dan iPod yang memiliki kemampuan dekoding relatif rendah.
High Profile: mendukung prediksi inter 8 × 8, kuantisasi kustom, pengkodean video tanpa kehilangan, dan lebih banyak format YUV, seperti 4:4:4. Profil ini juga mendukung fitur profil utama. Ini digunakan dalam aplikasi penyiaran dan penyimpanan disk, terutama dalam aplikasi televisi definisi tinggi. Misalnya, format penyimpanan Blu-ray Disc mengadopsi profil ini.
Laju Bit
Laju bit mengacu pada jumlah bit yang ditransmisikan per detik. Satuannya adalah bit per detik (bit/s). Laju bit yang lebih tinggi menunjukkan jumlah data yang lebih besar yang ditransmisikan. Dalam bidang video ini, the bit rate is equivalent to the bitrate. Laju bit menunjukkan jumlah bit yang diperlukan untuk merepresentasikan data audio atau video yang dikodekan (terkompresi) per detik. Bit adalah unit biner terkecil. Anda dapat mengatur bit ke 0 atau 1. Mirip dengan bitrate, laju bit yang lebih tinggi menunjukkan kualitas audio atau video yang lebih baik dan ukuran file yang lebih besar. Laju bit yang lebih kecil menunjukkan ukuran file yang lebih kecil.
Metode kontrol bitrate
Metode kontrol bitrate mengacu pada metode yang digunakan untuk mengontrol bitrate aliran terkode. Metode berikut didukung:
Variable bitrate (VBR): Saat metode ini digunakan, bitrate tidak tetap. Saat Anda menekan video atau file audio, perangkat lunak kompresi video atau audio menentukan bitrate berdasarkan kompleksitas data video atau audio. Metode ini menyeimbangkan kualitas dan ukuran file.
Constant bitrate (CBR): Saat metode ini digunakan, bitrate tetap untuk aliran terkode. File yang dikompresi dengan CBR lebih besar ukurannya dibandingkan dengan file yang dikompresi dengan VBR dan ABR. Namun, kualitas file yang dikompresi dengan CBR tidak jauh lebih baik dibandingkan dengan kualitas file yang dikompresi dengan VBR atau ABR.
Average bitrate (ABR): Metode ini adalah variasi VBR dengan parameter interpolasi. LAME menciptakan metode ini untuk menyelesaikan ketidakcocokan ukuran dan kualitas file yang dikompresi dengan CBR dan ukuran file yang tidak dapat diprediksi dari VBR. Dalam ukuran file tertentu, ABR membagi aliran menjadi bagian-bagian dalam unit 50 frame (sekitar 30 frame per detik), dan menggunakan bitrate yang relatif rendah untuk mengkode segmen yang kurang kompleks dan bitrate tinggi untuk mengkode bagian yang lebih kompleks. ABR dapat dianggap sebagai kompromi antara VBR dan CBR.
Bitrate dapat mencapai nilai yang ditentukan dalam rentang waktu tertentu, tetapi bitrate puncak di beberapa bagian dapat melebihi bitrate yang ditentukan. Rata-rata bitrate tetap konstan. ABR adalah versi modifikasi dari VBR. ABR memastikan bahwa rata-rata output bitrate berada dalam rentang yang sesuai dan mengkode video dalam rentang ini berdasarkan kompleksitas. Alibaba Cloud menggunakan ABR sebagai metode kontrol bitrate default.
Format Pengkodean
Untuk informasi lebih lanjut, lihat deskripsi codec dalam bagian sebelumnya. Codec audio diklasifikasikan menjadi codec lossy dan codec lossless. Berdasarkan teori sampling, codec audio dapat menghasilkan sinyal yang tak terbatas mendekati sinyal alami. Oleh karena itu, semua codec audio adalah codec lossy. Di bidang komputer, pulse-code modulation (PCM) adalah codec lossless konvensional karena mencapai fidelitas tertinggi di antara semua codec audio. Codec audio umum di Internet, seperti MP3 dan AAC, semuanya adalah codec lossy.
Laju sampel
Laju sampel mendefinisikan jumlah sampel yang diekstraksi dari sinyal waktu kontinu per detik untuk membentuk sinyal waktu diskrit. Diukur dalam Hz, ini mewakili seberapa sering sinyal analog diambil sampelnya saat dikonversi ke digital. Laju sampel yang lebih tinggi menghasilkan representasi yang lebih akurat dan alami dari suara aslinya.
Saluran Suara
Saluran suara mengacu pada sinyal audio independen yang dikumpulkan atau diputar saat suara direkam atau diputar di posisi spasial yang berbeda. Jumlah saluran suara mengacu pada jumlah sumber suara selama rekaman atau jumlah speaker selama pemutaran.
UTC (format waktu standar ISO 8601)
Coordinated Universal Time (UTC) juga dikenal sebagai waktu dunia seragam, waktu standar dunia, dan waktu koordinasi internasional. Akronim dari istilah dalam bahasa Inggris adalah CUT dan TUC dalam bahasa Prancis. Akronim UTC digunakan sebagai kompromi. UTC adalah sistem meterai waktu berdasarkan detik atom, yang mendekati waktu universal. Daratan Tiongkok mengadopsi standar Elemen Data dan Format Pertukaran-Informasi Pertukaran-Representasi Tanggal dan Waktu (ISO 8601:1988 atau GB/T 7408-1994), dan merujuk UTC sebagai waktu koordinasi internasional.
Secara default, semua bidang waktu yang dikembalikan dan parameter waktu dalam permintaan API di ApsaraVideo VOD dalam UTC. Waktu ditampilkan dalam format YYYY-MM-DDThh:mm:ssZ dan mengikuti standar ISO8601. Misalnya, 2017-01-11T12:00:00Z menunjukkan 20:00:00 pada 11 Januari 2017 dalam UTC+8 (Waktu Standar Tiongkok). Perbedaan antara Waktu Standar Tiongkok dan UTC adalah 8 jam. Oleh karena itu, UTC+8 menunjukkan Waktu Standar Tiongkok.
Istilah SDK Video Pendek
Perekaman multi-sumber
Perekaman multi-sumber mendukung perekaman berbagai sumber tangkapan video, seperti tampilan layar dan feed kamera, menjadi satu video. Ini menggabungkan beberapa sumber video sesuai dengan tata letak yang ditentukan, seperti split screen horizontal, split screen vertikal, dan Gambar-dalam-Gambar (PiP). Setiap frame video komposit berisi data video dari sumber-sumber ini secara bersamaan.
Perekaman duet
Perekaman duet memungkinkan Anda merekam duet yang terdiri dari video sampel dan video yang ditangkap oleh kamera. Kedua video diatur dalam tata letak yang ditentukan. Audio dari video sampel digunakan sebagai audio duet.
Gambar berikut menunjukkan tata letak sampel. Untuk detailnya, lihat Tata Letak.
Track
Track mewakili sumber data video atau audio yang berbeda. Ini membantu pengembang mengelola aliran konten media yang berbeda dalam satu rekaman.
Contoh:
Untuk perekaman duet, Track A mungkin berisi data video yang ditangkap oleh kamera, sedangkan Track B mungkin berisi video sampel.
Untuk perekaman multi-sumber, Track A mungkin berisi data video yang ditangkap oleh kamera, sedangkan Track B mungkin berisi rekaman layar.
Tata Letak
Tata letak adalah properti yang menggambarkan bagaimana gambar video diposisikan dalam video komposit. Tata letak dijelaskan dalam sistem koordinat normalisasi menggunakan dua dimensi: koordinat titik pusat video dan ukuran track (lebar dan tinggi).
Ambil layar berdampingan sebagai contoh:
Dalam tata letak ini, Track A (feed kamera) dan Track B (video sampel atau rekaman layar) masing-masing menempati setengah layar. Oleh karena itu, kedua track memiliki lebar 0,5 dan tinggi 1,0. Koordinat titik pusat track A adalah (0,25, 0,5), dan track B adalah (0,75, 0,5).