このトピックでは、Intelligent Media Management (IMM) の CreateMediaConvertTask 操作を使用して音声ファイルをマージする方法について説明します。
機能紹介
音声マージとは、複数の音声セグメントを連続した音声ファイルに結合する技術です。 音声マージにより、ユーザーは編集と統合のために異なる音声素材を選択して、表現力豊かで自然に一貫性のある音声作品を作成できます。

シナリオ
音楽制作: 音楽制作プロセスでは、音声マージ技術を使用して、さまざまな楽器トラック、ボーカルパート、またはセグメントを完全な音楽作品に統合し、制作プロセスの柔軟性と創造性を向上させます。
音声編集: ニュースレポート、ドキュメンタリー、その他の音声番組の編集プロセスでは、音声マージ技術は、エディターが音声コンテンツを最適化して、一貫性と聞きやすさを向上させるのに役立ちます。
教育とトレーニング: コースや講義をマージして、さまざまなコンテンツセグメントを統合し、学生が学習と復習に便利な音声教材を作成できます。
サポートされている音声およびビデオ 形式
カテゴリ | 形式 |
音声 | AAC、MP3、WAV、FLAC、WMA、AC3、Opus など、主要な音声 形式。 |
ビデオ | MP4、MPEG-TS、MKV、MOV、AVI、FLV、M3U8、WebM、WMV、RM、VOB など、主要なビデオ 形式。 |
音声マージを使用する
前提条件
AccessKey ペアが作成され、取得されています。 詳細については、「AccessKey ペアを作成する」をご参照ください。
Object Storage Service (OSS) がアクティブ化され、バケットが作成されています。 詳細については、「バケットを作成する」をご参照ください。
IMM がアクティブ化されています。 詳細については、「IMM をアクティブ化する」をご参照ください。
IMM コンソールで プロジェクト が作成されています。 詳細については、「プロジェクトを作成する」をご参照ください。
説明CreateProject 操作を呼び出して プロジェクト を作成できます。 詳細については、「CreateProject」をご参照ください。
ListProjects 操作を呼び出して、リージョン内のすべての プロジェクト の情報を一覧表示できます。
ステップ 1: ファイルをアップロードする
OSS コンソール を使用して、IMM プロジェクト が配置されているリージョンのバケットにメディアファイルをアップロードできます。

ステップ 2: IMM 音声マージを使用する
CreateMediaConvertTask 操作を呼び出して、音声マージ タスク を作成します。
パラメーター例
次の例では、IMM プロジェクト test-project を使用して音声マージ処理を行います。 メディア処理機能の詳細については、「メディア トランスコード中」をご参照ください。
CreateMediaConvertTask 操作を使用して、OpenAPI Explorer でビデオファイルを処理できます。 詳細については、SDK サンプル コード を参照してください。
開始セグメントと終了セグメントを音声ファイルにマージする
入力音声ファイルへの パス:
oss://test-bucket/video-demo/head.mp3、oss://test-bucket/video-demo/test.mp3、oss://test-bucket/video-demo/tail.mp3メインメディアファイル インデックス: 1
音声 構成: AAC 形式、96 Kbit/s ビットレート、デュアル サウンドチャンネル、44.1 kHz サンプルレート
出力音声 形式: AAC
出力ファイル パス:
oss://test-bucket/video-demo/concat.aacマージ完了通知: Simple Message Queue (SMQ) メッセージを SMQ Topic 「test-mns-topic」に送信します。
SDK サンプル コード については、OpenAPI Explorer にアクセスしてください。 サンプル コード の パラメーター は、 リファレンス 用に自動的に構成されています。 デバッグ を実行する前に、ビジネス要件に基づいて パラメーター を変更してください。
リクエスト パラメーター
{
"ProjectName": "test-project",
"AlignmentIndex": 1,
"Notification": {
"MNS": {
"TopicName": "test-mns-topic"
}
},
"Sources": [
{
"URI": "oss://test-bucket/video-demo/head.mp3"
},
{
"URI": "oss://test-bucket/video-demo/test.mp3"
},
{
"URI": "oss://test-bucket/video-demo/tail.mp3"
}
],
"Targets": [
{
"Audio": {
"TranscodeAudio": {
"Bitrate": 96000,
"Channel": 2,
"Codec": "aac",
"SampleRate": 44100
}
},
"Container": "aac",
"URI": "oss://test-bucket/video-demo/concat.{autoext}"
}
]
}2 つの音声セグメントを 1 つの MP3 音声ファイルにマージする
入力音声ファイルへの パス:
oss://test-bucket/video-demo/test.mp3、oss://test-bucket/video-demo/test1.mp3メインメディアファイル インデックス: 0
音声 構成: MP3 形式、128 Kbit/s ビットレート、デュアル サウンドチャンネル、44.1 kHz サンプルレート
出力音声 形式: MP3
出力ファイル パス:
oss://test-bucket/video-demo/concat.mp3マージ完了通知: SMQ メッセージを SMQ Topic 「test-mns-topic」に送信します。
SDK サンプル コード については、OpenAPI Explorer にアクセスしてください。 サンプル コード の パラメーター は、 リファレンス 用に自動的に構成されています。 デバッグ を実行する前に、ビジネス要件に基づいて パラメーター を変更してください。
リクエスト パラメーター
{
"ProjectName": "test-project",
"AlignmentIndex": 0,
"Notification": {
"MNS": {
"TopicName": "test-mns-topic"
}
},
"Sources": [
{
"URI": "oss://test-bucket/video-demo/test.mp3"
},
{
"URI": "oss://test-bucket/video-demo/test1.mp3"
}
],
"Targets": [
{
"Audio": {
"TranscodeAudio": {
"Bitrate": 128000,
"Channel": 2,
"Codec": "mp3",
"SampleRate": 44100
}
},
"Container": "mp3",
"URI": "oss://test-bucket/video-demo/concat.{autoext}"
}
]
}