オーディオトランスコーディングは、オーディオファイルを任意のフォーマットに変換します。本トピックでは、オーディオトランスコーディングのパラメーターについて説明し、使用例を紹介します。
ユースケース
-
さまざまな再生デバイスとの互換性を確保するために、音楽ファイルのフォーマットを変換します。
-
大容量の可逆圧縮(ロスレス)オーディオファイルを MP3 などの高圧縮率の非可逆圧縮(ロッシー)フォーマットにトランスコードして、ストレージ容量を最適化します。
-
オンラインストリーミングサービスにおいて、ネットワーク状況に応じて複数のビットレートでオーディオをトランスコードし、低帯域幅接続でもスムーズな再生を実現します。
-
動画制作およびポストプロダクション向けに、プロジェクト要件またはディストリビューション基準に合わせてオーディオアセットをトランスコードします。
注意事項
-
オーディオトランスコーディングは非同期処理のみをサポートしており、
x-oss-async-processメソッドを使用して呼び出します。 -
オーディオトランスコーディングを使用する前に、Intelligent Media Management (IMM) プロジェクトを OSS バケットに関連付ける必要があります。詳細については、「クイックスタート」および「AttachOSSBucket」をご参照ください。
-
匿名アクセスは拒否されます。
-
この機能を使用するには、必要な権限が必要です。詳細については、「permissions」をご参照ください。
-
デフォルトのサンプリングレートまたはオーディオチャンネル数が、ターゲットコンテナフォーマットと互換性がない場合、トランスコーディングが失敗することがあります。
-
オーディオトランスコーディングでは、
flacフォーマットの場合にのみサンプリングビット深度を設定できます。動画トランスコーディングでは、OSS のx-oss-process操作のpixfmtパラメーターを使用してビット深度を設定できます。詳細については、「動画トランスコーディング」をご参照ください。
パラメーター
操作: audio/convert
以下の表にパラメーターを示します。
|
パラメーター |
タイプ |
必須 |
説明 |
|
ss |
int |
いいえ |
トランスコーディングの開始時刻(ミリ秒単位)。有効値:
|
|
t |
int |
いいえ |
トランスコーディングの持続時間(ミリ秒単位)。有効値:
|
|
f |
string |
はい |
出力コンテナフォーマット。有効値:
|
|
ar |
int |
いいえ |
出力オーディオのサンプリングレート。デフォルトでは、ソースオーディオのサンプリングレートが使用されます。有効値:
説明
サポートされるサンプリングレートはフォーマットによって異なります。MP3 は最大 48 kHz までサポートします。Opus は 8 kHz、12 kHz、16 kHz、24 kHz、48 kHz をサポートします。AC3 は 32 kHz、44.1 kHz、48 kHz をサポートします。AMR は 8 kHz および 16 kHz のみをサポートします。 |
|
ac |
int |
いいえ |
出力オーディオチャンネル数。デフォルトでは、ソースオーディオのチャンネル数が使用されます。有効値範囲:1 ~ 8。 説明
サポートされるオーディオチャンネル数はフォーマットによって異なります。MP3 はモノラルおよびステレオのみをサポートします。AC3 は最大 6 チャンネル(5.1)をサポートします。AMR はモノラルのみをサポートします。 |
|
aq |
int |
いいえ |
オーディオ品質。このパラメーターは ab パラメーターと相互排他です。有効値範囲:0 ~ 100。 |
|
ab |
int |
いいえ |
オーディオビットレート(bps 単位)。このパラメーターは aq パラメーターと相互排他です。有効値範囲:1,000 ~ 10,000,000。 |
|
abopt |
string |
いいえ |
オーディオビットレートオプション。有効値:
|
|
adepth |
int |
いいえ |
出力オーディオのサンプリングビット深度。有効値:16 および 24。 説明
このパラメーターは、f が flac に設定されている場合にのみ有効です。 |
sys/saveas パラメーターおよび notify パラメーターもオーディオトランスコーディングで使用されます。詳細については、「sys/saveas」および「Notifications」をご参照ください。
REST API の使用
MP3 から AAC への変換
ジョブ構成
-
コンテナフォーマット:mp3 から aac
-
ソースファイル:example.mp3
-
トランスコードの持続時間: 60,000 ミリ秒(10,000 ミリ秒目から開始)
-
オーディオ設定:元のサンプリングレートおよびオーディオチャンネル数を維持し、オーディオビットレートを 96 Kbps に設定します。
-
完了通知:MNS を使用してメッセージを送信します。
リクエスト例
// example.mp3 という名前のオーディオファイルをトランスコードします。
POST /example.mp3?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
x-oss-async-process=audio/convert,ss_10000,t_60000,f_aac,ab_96000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0
WAV から Opus への変換
ジョブ構成
-
コンテナフォーマット:wav から opus
-
トランスコーディング持続時間:オーディオファイル全体。
-
オーディオ設定:48 kHz サンプリングレート、2 チャンネル、96 Kbps オーディオビットレート。
-
出力パス:oss://outbucket/outobject.opus
-
完了通知:MNS を使用してメッセージを送信します。
リクエスト例
// example.wav という名前のオーディオファイルをトランスコードします。
POST /example.wav?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
x-oss-async-process=audio/convert,f_opus,ab_96000,ar_48000,ac_2|sys/saveas,b_b3V0YnVja2V0, o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0
SDK の使用
Java、Python、および Go SDK を使用して、非同期オーディオトランスコーディングを実行できます。
Java
SDK for Java 3.17.4 以降が必要です。
import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;
import java.util.Base64;
public class Demo {
public static void main(String[] args) throws ClientException {
// yourEndpoint: ご利用のバケットが配置されているリージョンのエンドポイント。
String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
// エンドポイントのリージョン ID(例:cn-hangzhou)。
String region = "cn-hangzhou";
// 環境変数からアクセス認証情報を取得します。このサンプルコードを実行する前に、OSS_ACCESS_KEY_ID および OSS_ACCESS_KEY_SECRET 環境変数が設定されていることを確認してください。
EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
// バケット名を指定します。
String bucketName = "examplebucket";
// トランスコード後のオーディオファイルを指定します。
String targetKey = "dest.aac";
// ソースオーディオファイルを指定します。
String sourceKey = "src.mp3";
// OSSClient インスタンスを作成します。
// OSSClient インスタンスの使用が終了したら、shutdown メソッドを呼び出してリソースを解放してください。
ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
OSS ossClient = OSSClientBuilder.create()
.endpoint(endpoint)
.credentialsProvider(credentialsProvider)
.clientConfiguration(clientBuilderConfiguration)
.region(region)
.build();
try {
// オーディオ処理スタイル文字列およびオーディオトランスコーディングパラメーターを構築します。
String style = String.format("audio/convert,ss_10000,t_60000,f_aac,ab_96000");
// 非同期処理命令を構築します。
String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);
// AsyncProcessObjectRequest オブジェクトを作成します。
AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
// 非同期処理タスクを実行します。
AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
System.out.println("EventId: " + response.getEventId());
System.out.println("RequestId: " + response.getRequestId());
System.out.println("TaskId: " + response.getTaskId());
} finally {
// OSSClient をシャットダウンします。
ossClient.shutdown();
}
}
}
Python
SDK for Python 2.18.4 以降が必要です。
# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider
def main():
# 環境変数からアクセス認証情報を取得します。このサンプルコードを実行する前に、環境変数が設定されていることを確認してください。
auth = oss2.ProviderAuth(EnvironmentVariableCredentialsProvider())
# バケットが配置されているリージョンのエンドポイント(例:中国 (杭州) の場合、https://oss-cn-hangzhou.aliyuncs.com を使用)。
endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
# バケット名を指定します(例:examplebucket)。
bucket = oss2.Bucket(auth, endpoint, 'examplebucket')
# ソースオーディオファイルの名前を指定します。
source_key = 'src.mp3'
# トランスコード後のオーディオファイルの名前を指定します。
target_key = 'dest.aac'
# オーディオ処理スタイル文字列およびオーディオトランスコーディングパラメーターを構築します。
audio_style = 'audio/convert,ss_10000,t_60000,f_aac,ab_96000'
# 保存パスおよび Base64 エンコードされたバケット名とターゲットオブジェクト名を含む処理命令を構築します。
bucket_name_encoded = base64.urlsafe_b64encode('examplebucket'.encode()).decode().rstrip('=')
target_key_encoded = base64.urlsafe_b64encode(target_key.encode()).decode().rstrip('=')
process = f"{audio_style}|sys/saveas,b_{bucket_name_encoded},o_{target_key_encoded}/notify,topic_QXVkaW9Db252ZXJ0"
try:
# 非同期処理タスクを実行します。
result = bucket.async_process_object(source_key, process)
print(f"EventId: {result.event_id}")
print(f"RequestId: {result.request_id}")
print(f"TaskId: {result.task_id}")
except Exception as e:
print(f"Error: {e}")
if __name__ == "__main__":
main()
Go
SDK for Go 3.0.2 以降が必要です。
package main
import (
"encoding/base64"
"fmt"
"log"
"os"
"github.com/aliyun/aliyun-oss-go-sdk/oss"
)
func main() {
// 環境変数から一時的なアクセス認証情報を取得します。このサンプルコードを実行する前に、OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、および OSS_SESSION_TOKEN 環境変数が設定されていることを確認してください。
provider, err := oss.NewEnvironmentVariableCredentialsProvider()
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// OSSClient インスタンスを作成します。
// yourEndpoint: ご利用のバケットが配置されているリージョンのエンドポイント(例:中国 (杭州) の場合、https://oss-cn-hangzhou.aliyuncs.com を使用)。実際のリージョンに応じて設定してください。
// yourRegion: リージョン ID(例:cn-hangzhou)。
client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// バケット名を指定します(例:examplebucket)。
bucketName := "examplebucket"
bucket, err := client.Bucket(bucketName)
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// ソースオーディオファイルの名前を指定します。
sourceKey := "src.mp3"
// トランスコード後のオーディオファイルの名前を指定します。
targetKey := "dest.aac"
// オーディオ処理スタイル文字列およびオーディオトランスコーディングパラメーターを構築します。
audioStyle := "audio/convert,ss_10000,t_60000,f_aac,ab_96000"
// 保存パスおよび Base64 エンコードされたバケット名とターゲットオブジェクト名を含む処理命令を構築します。
bucketNameEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
targetKeyEncoded := base64.URLEncoding.EncodeToString([]byte(targetKey))
process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v/notify,topic_QXVkaW9Db252ZXJ0", audioStyle, bucketNameEncoded, targetKeyEncoded)
// 非同期処理タスクを実行します。
result, err := bucket.AsyncProcessObject(sourceKey, process)
if err != nil {
log.Fatalf("Failed to async process object: %s", err)
}
fmt.Printf("EventId: %s\n", result.EventId)
fmt.Printf("RequestId: %s\n", result.RequestId)
fmt.Printf("TaskId: %s\n", result.TaskId)
}