Intelligent Media Management (IMM) は、オーディオおよびビデオファイルのフォーマット変換、コンテナフォーマット変換、解像度調整、フレームレート調整、ビデオスナップショット、スプライト生成、およびウォーターマークを実行できるメディアトランスコーディング機能を提供します。このトピックでは、メディアトランスコーディング機能について詳しく説明します。
機能概要
Intelligent Media Management (IMM) のメディアトランスコーディング機能は、メディアファイルを処理するためのワンストップソリューションです。この機能により、フォーマット変換、コンテナフォーマット変換、解像度調整、フレームレート調整などの操作を簡単に実行できます。これにより、ビデオおよびオーディオファイルがさまざまな再生デバイスや要件に対応します。

前提条件
AccessKey ペアが作成され、取得されていること。詳細については、「AccessKey ペアの作成」をご参照ください。
OSS が有効化され、バケットが作成され、オブジェクトがバケットにアップロードされていること。詳細については、「オブジェクトのアップロード」をご参照ください。
IMM が有効化されていること。詳細については、「IMM の有効化」をご参照ください。
IMM コンソールでプロジェクトが作成されていること。IMM コンソールを使用してプロジェクトを作成する方法の詳細については、「プロジェクトの作成」をご参照ください。
説明CreateProject 操作を呼び出してプロジェクトを作成することもできます。詳細については、「CreateProject」をご参照ください。
ListProjects 操作を呼び出して、特定のリージョンに存在するプロジェクトをクエリできます。詳細については、「ListProjects」をご参照ください。
注意
問題が発生した場合は、DingTalk グループ (ID: 88490020073) に参加して、Alibaba Cloud Intelligent Media Management のエンジニアとリアルタイムでコミュニケーションをとってください。
メディアトランスコーディング API 操作の使用には料金がかかります。詳細については、「課金の概要」をご参照ください。
サポートされているオーディオおよびビデオフォーマット
分類 | フォーマット |
オーディオ | AAC、MP3、WAV、FLAC、WMA、AC3、OPUS などのすべての主流フォーマット。 |
ビデオ | MP4、MPEG-TS、MKV、MOV、AVI、FLV、M3U8、WebM、WMV、RM、VOB などの複数の主流フォーマット。 |
メリット
比較項目 | Alibaba Cloud トランスコーディング | 自己管理型トランスコーディング |
トランスコーディング機能 | オンデマンドでトランスコーディングリソースを動的に調整する、高速で安定した並列トランスコーディングシステム。リソースを自動的にスケールインまたはスケールアウトし、クラスターリソースをシームレスに拡張して、高同時実行トランスコーディングリクエストを処理します。 | 大規模で高同時実行のトランスコーディングタスクをサポートするのは困難です。 |
トランスコーディングアルゴリズム | 強力な計算リソースと高度なビデオ処理アルゴリズム。 | オープンソースのトランスコーディングサービスに依存します。 |
特徴 | ビデオトランスコーディング、コンテナフォーマット変換、HLS への変換、ビデオからアニメーション画像への変換、ビデオ結合、ビデオスナップショット、ビデオスプライト生成、オーディオトランスコーディング、オーディオ抽出、字幕抽出。 | オープンソースのトランスコーディングサービスと統合し、トランスコーディングサービスをゼロから構築する必要があります。 |
機能説明
次の表に、IMM メディアトランスコーディングの機能を示します。
機能 | 説明 |
ビデオエンコード形式の変換、コンテナフォーマットの変換、解像度の調整、フレームレートの調整、ビットレートの調整。 | |
ビデオから特定のフレームを抽出し、静止画像として保存して特定の瞬間をキャプチャします。 | |
オーディオフォーマットの変換、ビットレートの調整、サウンドチャンネル数の調整、サンプルレートの調整。 | |
複数のビデオフレームを 1 つの画像ファイルに結合し、グリッド状に配置します。これにより、スプライトのような効果が生まれます。 | |
ビデオファイルを GIF や WebP などのアニメーション画像フォーマットに変換します。 | |
ビデオファイルから字幕情報を抽出します。 | |
複数のビデオクリップを 1 つの完全なビデオに結合し、ビデオを必要なフォーマットに変換します。 | |
複数のオーディオクリップを 1 つの連続したオーディオファイルに結合します。 |
よくある質問
ビデオトランスコーディングリクエストが失敗した場合はどうすればよいですか?
ビデオトランスコーディングリクエストが失敗した場合は、TargetAudio.Codec パラメーターを `copy` 以外の値に設定してリクエストを再試行してください。詳細については、「TargetAudio」をご参照ください。
ビデオトランスコーディング後にファイルサイズが大きくなるのはなぜですか?
ビデオトランスコーディングからの出力ファイルは、ソースファイルよりも大きくなることがあります。これは、オーディオおよびビデオのトランスコーディングが非可逆圧縮の一種であるためです。圧縮アルゴリズムはより大きなファイルを生成する場合がありますが、これによりソースファイルと比較して画質や音質が向上することはありません。これは、圧縮中に失われる品質が少ないことを示しているだけです。
出力ファイルサイズを制御するには、`TargetVideo` の `BitrateOption`、`Bitrate`、または `CRF` パラメーターを設定して、ビデオストリームのビットレートを制御します。`TargetAudio` の `BitrateOption`、`Bitrate`、または `Quality` パラメーターを設定して、オーディオストリームのビットレートを制御することもできます。
ビデオトランスコーディングタスクはキャンセルできますか?
この操作はキャンセルできません。
トランスコーディング後、ビデオの向きが正しくありません。どうすれば調整できますか?
TargetVideo パラメーター構成で、`Codec` を `copy` 以外の値に設定し、`AdaptiveResolutionDirection` を `true` に設定します。これにより、ビデオの解像度に基づいて自動回転が有効になります。
トランスコーディング後にビデオが引き伸ばされます。これを防ぐにはどうすればよいですか?
TargetVideo パラメーター構成で、`Codec` を `copy` 以外の値に設定し、`AdaptiveResolutionDirection` を `true` に設定して自動回転を有効にし、`ScaleType` を `fit` に設定して黒枠なしでビデオを比例的にスケーリングします。
ビデオトランスコーディングに固定ビットレートを設定するにはどうすればよいですか? bitrate パラメーターだけを設定しても機能しないのはなぜですか?
TargetVideo パラメーターでは、
bitrateパラメーターは可変ビットレート (VBR) を設定し、固定ビットレート (CBR) はサポートしていません。VBR と CBR の主な違いは、瞬間的なビットレートです。固定ビットレートが必要な場合は、maxbitrateパラメーターを設定します。
トランスコーディングに成功したビデオの再生時間を取得するにはどうすればよいですか?
再生時間を取得するには、DetectMediaMeta API 操作を呼び出すか、`x-oss-process` の `video/info` パラメーターを使用します。詳細については、「ビデオ情報の抽出」をご参照ください。
CreateMediaConvertTask API 操作は RocketMQ 5.0 をサポートしていますか?
いいえ。現在サポートしているのは RocketMQ 4.0 です。