すべてのプロダクト
Search
ドキュメントセンター

Intelligent Media Management:メディアトランスコーディング

最終更新日:Jul 03, 2025

Intelligent Media Management (IMM) は、オーディオファイルとビデオファイルのフォーマット変換、コンテナフォーマット変換、解像度調整、フレームレート調整、フレームキャプチャ、スプライト抽出、およびウォーターマークの要件を満たすために、メディアトランスコーディング機能を提供します。このトピックでは、メディアトランスコーディングの詳細な機能について説明します。

機能概要

メディアトランスコーディングは、メディアファイルを処理するための一括ソリューションであり、フォーマット変換、コンテナフォーマット変換、解像度調整、フレームレート調整など、さまざまな操作を簡単に行うことで、ビデオファイルとオーディオファイルをさまざまな再生デバイスや要件に適合させることができます。

image

前提条件

  • AccessKey ペアが作成され、取得されています。詳細については、「AccessKey ペアを作成する」をご参照ください。

  • OSS がアクティブ化され、バケットが作成され、オブジェクトがバケットにアップロードされています。詳細については、「オブジェクトをアップロードする」をご参照ください。

  • IMM がアクティブ化されています。詳細については、「IMM をアクティブ化する」をご参照ください。

  • IMM コンソールでプロジェクトが作成されています。 IMM コンソールを使用してプロジェクトを作成する方法の詳細については、「プロジェクトを作成する」をご参照ください。

    説明
    • CreateProject オペレーションを呼び出して、プロジェクトを作成することもできます。詳細については、「CreateProject」をご参照ください。

    • ListProjects オペレーションを呼び出して、特定のリージョンにある既存のプロジェクトをクエリできます。詳細については、「ListProjects」をご参照ください。

考慮事項

  • メディアトランスコーディングの使用中にエラーが発生した場合は、DingTalk グループ(グループ番号:88490020073)に参加して、Alibaba Cloud IMM エンジニアとリアルタイムで通信してください。

  • メディアトランスコーディング API オペレーションに関連する機能の使用には料金が発生します。詳細については、「請求の概要」をご参照ください。

サポートされているオーディオ形式とビデオ形式

カテゴリ

形式

オーディオ

AAC、MP3、WAV、FLAC、WMA、AC3、Opus など、主要なオーディオ形式。

ビデオ

MP4、MPEG-TS、MKV、MOV、AVI、FLV、M3U8、WebM、WMV、RM、VOB など、主要なビデオ形式。

メリット

比較項目

Alibaba Cloud トランスコーディング

セルフマネージドトランスコーディング

トランスコーディングシステム

並列トランスコーディング用の高速で安定したシステムを使用します。システムは、ビジネス要件に基づいてトランスコーディングリソースを動的に調整および自動スケーリングし、クラスターリソースをシームレスにスケールアウトして、多数の同時トランスコーディングタスクを処理できます。

多くの場合、多数の同時トランスコーディングタスクを処理できません。

トランスコーディングアルゴリズム

強力な計算リソースと高度なビデオ処理アルゴリズムを提供します。

オープンソースのトランスコーディングサービスによって提供されるアルゴリズムに依存します。

機能

ビデオトランスコーディング、ビデオコンテナフォーマット変換、HTTP ライブストリーミングプロトコル (HLS) へのビデオフォーマット変換、アニメーション画像へのビデオ変換、ビデオ連結、ビデオスナップショット、ビデオからのスプライト生成、オーディオトランスコーディング、オーディオ抽出、字幕抽出など、さまざまな機能をサポートしています。

基盤レイヤーでトランスコーディングサービスを最初から構築するために、オープンソースのトランスコーディングサービスを独自のビジネスに統合する必要があります。

機能

次の表に、IMM メディアトランスコーディングでサポートされている機能を示します。

機能

説明

ビデオトランスコーディング

ビデオエンコード形式変換、コンテナフォーマット変換、解像度調整、フレームレート調整、およびビットレート調整を提供します。

フレームキャプチャ

ビデオから特定のフレームを抽出し、特定の瞬間を静止画像として保存します。

オーディオトランスコーディング

オーディオ形式変換、ビットレート調整、サンプリングレート調整に加えて、サウンドチャンネル数の調整を提供します。

ビデオスプライト生成

動画の複数のフレームをグリッド形式で配置した単一の画像ファイルに結合して、スプライトを生成します。

アニメーション画像へのビデオ変換

ビデオファイルを GIF や WebP などのアニメーション画像形式に変換します。

ビデオ字幕抽出

ビデオファイルから字幕情報を抽出します。

ビデオマージ

複数のビデオクリップを完全なビデオにマージし、目的の形式に変換します。

オーディオマージ

複数のオーディオクリップを連続したオーディオファイルに統合します。

FAQ

  • ビデオトランスコーディングリクエストが失敗した場合はどうすればよいですか?

    • TargetAudio.Codec パラメーター を copy 以外の値に設定し、リクエストをリトライできます。詳細については、「TargetAudio」をご参照ください。

  • ビデオのトランスコード後にファイルサイズが大きくなるのはなぜですか?

    • ビデオのトランスコード後に生成されるファイルがソースファイルよりも大きくなる主な理由は、オーディオとビデオのトランスコーディングに非可逆圧縮が使用されているためです。圧縮アルゴリズムはより大きなメディアファイルを生成できますが、ソースファイルよりも高いビデオまたはオーディオ品質を提供することはできません。代わりに、アルゴリズムは比較的わずかな程度で品質を損ないます。

    • 生成されるファイルサイズを制御するには、TargetVideo パラメーターで BitrateOption、Bitrate、または CRF パラメーターを指定して、ビデオストリームのビットレートを調整できます。また、TargetAudio パラメーターで BitrateOption、Bitrate、または Quality パラメーターを指定して、オーディオストリームのビットレートを決定することもできます。

  • ビデオトランスコーディングタスクをキャンセルできますか?

    • いいえ、ビデオトランスコーディングタスクはキャンセルできません。

  • 間違った方向のトランスコードされたビデオの方向を調整するにはどうすればよいですか?

    • オーディオ処理設定を指定する TargetVideo では、Codec パラメーターを copy 以外の値に設定し、AdaptiveResolutionDirection パラメーターを true に設定して、適応解像度方向を有効にすることができます。

  • トランスコード後にビデオが引き伸ばされないようにするにはどうすればよいですか?

    • オーディオ処理設定を指定する TargetVideo では、Codec パラメーターを copy 以外の値に設定し、AdaptiveResolutionDirection パラメーターを true に設定して適応解像度方向を有効にし、ScaleType パラメーターを fit に設定してビデオのサイズを比例的に変更し、黒い境界線を削除できます。

  • ビデオトランスコーディングタスクにビットレートパラメーターが指定されている場合、固定ビットレートを設定できないのはなぜですか?

    • TargetVideo パラメーターでは、bitrate パラメーターは可変ビットレート (VBR) をサポートしますが、固定ビットレート (CBR) はサポートしません。 VBR と CBR の違いは、主に瞬間ビットレートにあります。ビジネス要件に基づいて maxbitrate パラメーターを指定できます。

  • トランスコードされたビデオの再生時間を取得するにはどうすればよいですか?

    • DetectMediaMeta オペレーションを呼び出すか、x-oss-process の video/info パラメーターを使用できます。詳細については、「ビデオ情報抽出」をご参照ください。

  • IMM の CreateMediaConvertTask オペレーションは ApsaraMQ for RocketMQ 5.0 をサポートしていますか?

    • いいえ、CreateMediaConvertTask オペレーションは ApsaraMQ for RocketMQ 4.0 のみをサポートしています。