すべてのプロダクト
Search
ドキュメントセンター

Object Storage Service:オーディオのマージとは?

最終更新日:Jun 28, 2025

オーディオのマージ機能を使用すると、複数のオーディオオブジェクトを指定した形式の単一のオーディオオブジェクトにマージできます。 このトピックでは、オーディオのマージパラメーターについて説明し、オーディオのマージの例を示します。

シナリオ

  • 音楽の作成と制作:音楽制作者とプロデューサーは、個々の楽器とボーカルの録音を組み合わせて完全な曲を作成する必要があることがよくあります。

  • オーディオブックと音声コンテンツの作成:オーディオブックの制作プロセスでは、通常、オーディオの章を順番にマージして、ストーリーをシームレスに提示します。

  • 映画とテレビのポストプロダクション:映画、テレビシリーズ、またはアニメーションのポストプロダクション中に、ダイアログ、ナレーション、周囲の音、楽器の音などの要素を綿密にブレンドして、画面上のコンテンツを補完する没入型のオーディオエクスペリエンスを作成します。

  • ソーシャルメディアコンテンツの作成:ソーシャルメディアコンテンツクリエーターは、さまざまな効果音、ナレーション、バックグラウンドサウンドを統合して、コンテンツの表現力を高めます。

使用方法

  • オーディオのマージは、非同期処理(x-oss-async-process)のみをサポートします。

  • 対応する Object Storage Service (OSS) バケットを Intelligent Media Management (IMM) プロジェクトにバインドしていることを確認してください。 OSS コンソールで OSS バケットを IMM プロジェクトにバインドする方法の詳細については、「クイックスタート」をご参照ください。 IMM API を使用して OSS バケットを IMM プロジェクトにバインドする方法の詳細については、「AttachOSSBucket」をご参照ください。

  • 匿名アクセスは拒否されます。

  • この機能を使用するには、必要な権限を持っている必要があります。 詳細については、「権限」をご参照ください。

  • デフォルトのサンプリングレートまたはサウンドチャンネル数を使用すると、指定されたオーディオコンテナ形式との非互換性により、オーディオのマージが失敗する可能性があります。

  • 一度に最大 11 個のオーディオオブジェクトを 1 つのオーディオオブジェクトにマージできます。

パラメーター

アクション: audio/concat

次の表に、オーディオのマージ操作で設定できるパラメーターを示します。

マージのパラメーター

リクエスト文字列内の pre パラメーターと sur パラメーターの順序によって、オーディオオブジェクトがマージされる順序が決まります。

  • /pre: オーディオオブジェクトを他の指定されたオーディオオブジェクトの前に挿入します。

  • /sur: オーディオオブジェクトを他の指定されたオーディオオブジェクトの後に挿入します。

パラメーター

タイプ

必須

説明

ss

int

いいえ

マージが開始されるオーディオオブジェクトの時点。 単位:ミリ秒。 有効な値:

  • 0: マージされたオーディオの開始位置からマージが開始されます。 これはデフォルト値です。

  • 0より大きい整数:オーディオの指定されたミリ秒数からマージが開始されます。

t

int

いいえ

マージされるオーディオの長さ。 単位:ミリ秒。 有効な値:

  • 0: マージはオーディオオブジェクトの最後まで延長されます。 これはデフォルト値です。

  • 0より大きい整数:マージは、ミリ秒単位で指定されたオーディオの長さをカバーします。

o

string

はい

OSS バケット内のオーディオオブジェクトの名前。 名前には URL セーフ Base64 でエンコードする必要があります。

トランスコードのパラメーター

パラメーター

タイプ

必須

説明

ss

int

いいえ

トランスコードが開始される、マージされたオーディオオブジェクトの時点。 単位:ミリ秒。 有効な値:

  • 0: マージされたオーディオの開始位置からトランスコードが開始されます。 これはデフォルト値です。

  • 0より大きい整数:オーディオの指定されたミリ秒数からトランスコードが開始されます。

t

int

いいえ

トランスコードされるオーディオの長さ。 有効な値:

  • 0: トランスコードは、マージされたオーディオオブジェクトの最後まで延長されます。 これはデフォルト値です。

  • 0より大きい整数:トランスコードは、ミリ秒単位で指定されたマージされたオーディオの長さをカバーします。

f

string

はい

出力オーディオのコンテナ形式。

  • mp3

  • aac

  • flac

  • oga

  • ac3

  • opus

  • amr

ar

int

いいえ

出力オーディオのサンプリングレート。 デフォルトでは、出力オーディオのサンプリングレートは、[align] パラメーターで指定されたソースオーディオと同じです。

  • 8000

  • 11025

  • 12000

  • 16000

  • 22050

  • 24000

  • 32000

  • 44100

  • 48000

  • 64000

  • 88200

  • 96000

説明

サポートされているサンプリングレートは、形式によって異なります。MP3 は 48 kHz 以下、Opus は 8 kHz、12 kHz、16 kHz、24 kHz、48 kHz、AC3 は 32 kHz、44.1 kHz、48 kHz、AMR は 8 kHz と 16 kHz です。

ac

int

いいえ

出力オーディオのサウンドチャンネル数。 デフォルトでは、出力オーディオのサウンドチャンネル数は、[align] パラメーターで指定されたソースオーディオと同じです。 有効な値:1~8。

説明

サウンドチャンネル数は、オーディオ形式によって異なります。MP3 は 1 つまたは 2 つ、AC3 5.1 は最大 6 つ、AMR は 1 つです。

aq

int

いいえ

オーディオの圧縮品質。 有効な値:0~100。

説明

このパラメーターと [ab] パラメーターは相互に排他的です。 両方のパラメーターを空のままにすると、コーデックのデフォルトのビットレートが使用されます。

ab

int

いいえ

ターゲットオーディオビットレート。 単位:bit/s。 有効な値:1000~10000000。

abopt

string

いいえ

オーディオビットレートオプション。 有効な値:

  • 0: 常にターゲットオーディオビットレートを使用します。 これはデフォルト値です。

  • 1: マージされるオーディオオブジェクトの 1 つのビットレートが [ab] パラメーターで指定されたオーディオビットレートよりも低い場合、マージされるオーディオオブジェクトの中で最も低いビットレートを使用します。

  • 2: マージされるオーディオオブジェクトの 1 つのビットレートが [ab] パラメーターで指定されたオーディオビットレートよりも低い場合、エラーを返します。

説明

このパラメーターは、[ab] パラメーターと一緒に使用する必要があります。

align

int

いいえ

デフォルトのトランスコードパラメーターを取得するオーディオオブジェクトのシーケンス番号。 このパラメーターのデフォルト値は 0 で、マージされるオーディオオブジェクトのリストの最初のオーディオオブジェクトを指定します。

adepth

int

いいえ

出力オーディオのサンプリングビット深度。 有効な値:16 と 24。

説明

このパラメーターは、f パラメーターを flac に設定した場合にのみ有効になります。

説明

オーディオオブジェクトをマージするときに、sys/saveas パラメーターと notify パラメーターを使用する必要がある場合もあります。 詳細については、「sys/saveas」および「メッセージ通知」をご参照ください。

RESTful API の使用

異なる形式の 5 つのオーディオオブジェクトを AAC 形式のオーディオオブジェクトにマージする

タスク情報

  • ソースオブジェクト

    • オーディオ名:pre1.mp3、pre2.wav、example.oga、sur1.aac、sur2.wma

  • 処理方法

    • 期間と順序:

      オーディオ名

      順序

      期間

      pre1.mp3

      1

      オーディオ全体の長さ

      pre2.wav

      2

      最初の 2 秒

      example.oga

      3

      オーディオ全体の長さ

      sur1.aac

      4

      4 秒目から 10 秒目まで

      sur2.wma

      5

      10 秒目から最後まで

    • トランスコード完了通知:Simple Message Queue (SMQ) を使用します。

  • デスティネーションオブジェクト

    • オーディオ情報

      • オーディオ形式:AAC

      • オーディオ仕様:サンプリングレート 44.1 kHz、モノラルサウンドチャンネル

      • オーディオビットレート:96 Kbit/s

    • オブジェクトストレージパス

      • AAC オブジェクト:oss://outbucket/outobj.aac

リクエストの例

// オーディオオブジェクトをマージします。
POST /example.oga?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e

x-oss-async-process=audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_cHJlMS5tcDMK/pre,o_cHJlMi53YXYK,t_2000/sur,o_c3VyMS5hYWMK,ss_4000,t_10000/sur,o_c3VyMi53bWEK,ss_10000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

OSS SDK の使用

Java、Python、または Go の OSS SDK のみを使用して、オーディオオブジェクトを非同期的にマージできます。

Java

OSS SDK for Java V3.17.4 以降が必要です。

import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;

import java.nio.charset.StandardCharsets;
import java.util.Base64;

public class Demo {

    public static void main(String[] args) throws ClientException, ClientException {
        // バケットが配置されているリージョンのエンドポイントを指定します。
        String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
        // バケットが配置されているAlibaba CloudリージョンのIDを指定します。 例:cn-hangzhou。
        String region = "cn-hangzhou";
        // 環境変数からアクセス認証情報を取得します。 サンプルコードを実行する前に、OSS_ACCESS_KEY_IDおよびOSS_ACCESS_KEY_SECRET環境変数が設定されていることを確認してください。
        EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
        // バケットの名前を指定します。
        String bucketName = "examplebucket";
        // 出力オーディオの名前を指定します。
        String targetAudio = "dest.aac";
        // マージするオーディオオブジェクトを指定します。
        String audio1 = "src1.mp3";
        String audio2 = "src2.mp3";

        // OSSClientインスタンスを作成します。
        // OSSClientが不要になったら、shutdownメソッドを呼び出してリソースを解放します。
        ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
        clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
        OSS ossClient = OSSClientBuilder.create()
                .endpoint(endpoint)
                .credentialsProvider(credentialsProvider)
                .clientConfiguration(clientBuilderConfiguration)
                .region(region)
                .build();

        try {
            // 文字列型のstyle変数を作成して、オーディオマージパラメーターを格納します。
            String audio1Encoded = Base64.getUrlEncoder().encodeToString(audio1.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String audio2Encoded = Base64.getUrlEncoder().encodeToString(audio2.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String style = String.format("audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_%s/pre,o_%s,t_0", audio1Encoded, audio2Encoded);

            // 非同期処理命令を作成します。
            String bucketEncoded = Base64.getUrlEncoder().encodeToString(bucketName.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String targetEncoded = Base64.getUrlEncoder().encodeToString(targetAudio.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);

            // AsyncProcessObjectRequestオブジェクトを作成します。
            AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, audio1, process);
            // 非同期処理タスクを実行します。
            AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
            System.out.println("EventId: " + response.getEventId());
            System.out.println("RequestId: " + response.getRequestId());
            System.out.println("TaskId: " + response.getTaskId());

        } finally {
            // OSSClientインスタンスをシャットダウンします。
            ossClient.shutdown();
        }
    }
}

Python

OSS SDK for Python V2.18.4 以降が必要です。

# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider


def main():
    # 環境変数から一時的なアクセス認証情報を取得します。 サンプルコードを実行する前に、OSS_ACCESS_KEY_IDおよびOSS_ACCESS_KEY_SECRET環境変数が設定されていることを確認してください。
    auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())

    # バケットが配置されているリージョンのエンドポイントを指定します。 たとえば、バケットが中国 (杭州) リージョンにある場合は、エンドポイントをhttps://oss-cn-hangzhou.aliyuncs.comに設定します。
    endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'

    # バケットが配置されているAlibaba CloudリージョンのIDを指定します。 例:cn-hangzhou。
    region = 'cn-hangzhou'

    # バケットの名前を指定します。 例:examplebucket。
    bucket = oss2.Bucket(auth, endpoint, 'examplebucket', region=region)

    # 出力オーディオの名前を指定します。
    target_audio = 'dest.aac'

    # マージするオーディオオブジェクトを指定します。
    audio1 = 'src1.mp3'
    audio2 = 'src2.mp3'

    # 文字列型のstyle変数を作成して、オーディオマージパラメーターを格納します。
    audio1_encoded = base64.urlsafe_b64encode(audio1.encode()).decode().rstrip('=')
    audio2_encoded = base64.urlsafe_b64encode(audio2.encode()).decode().rstrip('=')
    style = f"audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_{audio1_encoded}/pre,o_{audio2_encoded},t_0"

    # 非同期処理命令を作成します。
    bucket_encoded = base64.urlsafe_b64encode(bucket_name.encode()).decode().rstrip('=')
    target_encoded = base64.urlsafe_b64encode(target_audio.encode()).decode().rstrip('=')
    process = f"{style}|sys/saveas,b_{bucket_encoded},o_{target_encoded}/notify,topic_QXVkaW9Db252ZXJ0"

    print(process)

    # 非同期処理タスクを実行します。
    try:
        result = bucket.async_process_object(audio1, process)
        print(f"EventId: {result.event_id}")
        print(f"RequestId: {result.request_id}")
        print(f"TaskId: {result.task_id}")
    except Exception as e:
        print(f"Error: {e}")


if __name__ == "__main__":
    main()

Go

OSS SDK for Go V3.0.2 以降が必要です。

package main

import (
	"encoding/base64"
	"fmt"
	"log"
	"os"

	"github.com/aliyun/aliyun-oss-go-sdk/oss"
)
func main() {
	// 環境変数から一時的なアクセス認証情報を取得します。 サンプルコードを実行する前に、OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、およびOSS_SESSION_TOKEN環境変数が設定されていることを確認してください。
	provider, err := oss.NewEnvironmentVariableCredentialsProvider()
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// OSSClientインスタンスを作成します。
	// バケットが配置されているリージョンのエンドポイントを指定します。 たとえば、バケットが中国 (杭州) リージョンにある場合は、エンドポイントをhttps://oss-cn-hangzhou.aliyuncs.comに設定します。
	// バケットが配置されているAlibaba CloudリージョンのIDを指定します。 例:cn-hangzhou。
	client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// バケットの名前を指定します。 例:examplebucket。
	bucketName := "examplebucket"

	bucket, err := client.Bucket(bucketName)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}

	// マージするオーディオオブジェクトを指定します。
	audio1 := "src1.mp3"
	audio2 := "src2.mp3"
	// 出力オーディオの名前を指定します。
	targetAudio := "dest.aac"

	// 文字列型のstyle変数を作成して、オーディオマージパラメーターを格納します。
	audio1Encoded := base64.URLEncoding.EncodeToString([]byte(audio1))
	audio2Encoded := base64.URLEncoding.EncodeToString([]byte(audio2))
	style := fmt.Sprintf("audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_%s/pre,o_%s,t_0", audio1Encoded, audio2Encoded)

	// 非同期処理命令を作成します。
	bucketEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
	targetEncoded := base64.URLEncoding.EncodeToString([]byte(targetAudio))
	process := fmt.Sprintf("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded)

	// 非同期処理タスクを実行します。
	result, err := bucket.AsyncProcessObject(audio1, process)
	if err != nil {
		log.Fatalf("Failed to async process object: %s", err)
	}

	fmt.Printf("EventId: %s\n", result.EventId)
	fmt.Printf("RequestId: %s\n", result.RequestId)
	fmt.Printf("TaskId: %s\n", result.TaskId)
}