オーディオ トランスコードを使用すると、オーディオ ファイルをあるフォーマットから別のフォーマットに変換できます。このトピックでは、オーディオ トランスコードのパラメーターについて説明し、トランスコードの例を紹介します。
シナリオ
オーディオ ファイルの変換: ダウンロードしたオーディオ ファイルが、特定のデバイスやプレーヤーでサポートされていないフォーマットである場合があります。再生を有効にするには、オーディオ ファイルを互換性のあるオーディオ フォーマットに変換する必要があります。
ストレージの最適化: FLAC などの高品質でロスレスのオーディオ フォーマットは、ストレージ容量を大量に消費する可能性があります。オーディオ トランスコードを使用することで、ユーザーはオーディオ ファイルを MP3 などの非可逆圧縮フォーマットに変換できます。これにより、圧縮率が向上し、モバイル デバイスの貴重なストレージ容量を節約できます。
オンライン メディア ストリーミング: オンライン音楽プラットフォームやラジオ局は、困難なネットワーク状況でもスムーズなリスニング エクスペリエンスを提供するために、元のオーディオ ファイルをさまざまなビットレートのバージョンに変換する必要があります。
ビデオ制作とポストプロダクション: ビデオ編集中に、元のオーディオ ファイルのサンプリング レートやビット深度などのパラメーターを調整したり、最適な転送効率を得るために圧縮フォーマットに変換したりする必要がある場合があります。
使用上の注意
オーディオ トランスコードは、非同期処理 (x-oss-async-process) のみをサポートします。
トランスコードするオーディオ ファイルを含む Object Storage Service (OSS) バケットが、Intelligent Media Management (IMM) プロジェクトにバインドされていることを確認してください。OSS コンソールで OSS バケットを IMM プロジェクトにバインドする方法の詳細については、「クイック スタート」をご参照ください。IMM API オペレーションを呼び出して OSS バケットを IMM プロジェクトにバインドする方法の詳細については、「AttachOSSBucket」をご参照ください。
匿名アクセスは拒否されます。
この機能を使用するには、必要な権限を持っている必要があります。詳細については、「権限」をご参照ください。
デフォルトのサンプリング レートまたはサウンド チャンネル数を使用すると、指定されたオーディオ コンテナ フォーマットとの非互換性により、オーディオ トランスコードが失敗する可能性があります。
オーディオ トランスコードでは、オーディオ ビット深度を調整することはできません。ビデオ トランスコードでは、
x-oss-processに基づいてpixfmtパラメーターを使用してビット深度を調整できます。詳細については、「ビデオ トランスコード」をご参照ください。
パラメーター
アクション: audio/convert
次の表に、オーディオ トランスコードのパラメーターを示します。
パラメーター | タイプ | 必須 | 説明 |
ss | int | いいえ | トランスコードを開始するオーディオ内の時刻。単位: ミリ秒。有効な値:
|
t | int | いいえ | 指定された開始時刻の後でトランスコードされるオーディオ コンテンツの長さ。単位: ミリ秒。有効な値:
|
f | string | はい | 出力オーディオのコンテナ フォーマット。
|
ar | int | いいえ | 出力オーディオのサンプリング レート。デフォルトでは、出力オーディオのサンプリング レートはソース オーディオと同じです。有効な値:
説明 サポートされるサンプリング レートは、フォーマットによって異なります。MP3 は 48 kHz 以下、Opus は 8 kHz、12 kHz、16 kHz、24 kHz、48 kHz、AC3 は 32 kHz、44.1 kHz、48 kHz、AMR は 8 kHz、16 kHz です。 |
ac | int | いいえ | 出力オーディオのサウンド チャンネル数。デフォルトでは、出力オーディオのサウンド チャンネル数はソース オーディオと同じです。有効な値: 1 ~ 8。 説明 サウンド チャンネル数は、オーディオ フォーマットによって異なります。MP3 は 1 つまたは 2 つ、AC3 5.1 は最大 6 つ、AMR は 1 つです。 |
aq | int | いいえ | オーディオ圧縮品質。このパラメーターと ab パラメーターは相互排他です。有効な値: 0 ~ 100。 |
ab | int | いいえ | オーディオ ビットレート。単位: bit/s。このパラメーターと aq パラメーターは相互排他です。有効な値: 1000 ~ 10000000。 |
abopt | string | いいえ | オーディオ ビットレート オプション。有効な値:
|
adepth | int | いいえ | 出力オーディオのサンプリング ビット深度。有効な値: 16 と 24。 説明 このパラメーターは、f パラメーターを flac に設定した場合にのみ有効になります。 |
RESTful API の使用
MP3 を AAC に変換する
トランスコード情報
トランスコード前
オーディオ フォーマット: MP3
オーディオ ファイル名: example.mp3
処理方法
トランスコードするオーディオの長さ: オーディオの 1000 ミリ秒目から 60,000 ミリ秒
トランスコード完了通知: Simple Message Queue (SMQ) を使用
トランスコード後
オーディオ情報
オーディオ フォーマット: AAC
オーディオ構成: ソース オーディオと同じサンプリング レートとサウンド チャンネル数
オーディオ ビットレート: 96 Kbit/s
ファイル ストレージ パス
AAC ファイル: oss://outbucket/outobjprefix.aac
リクエスト例
// オーディオ ファイル example.mp3 をトランスコードします。
POST /example.mp3?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
x-oss-async-process=audio/convert,ss_10000,t_60000,f_aac,ab_96000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0WAV を Opus に変換する
トランスコード情報
トランスコード前
オーディオ フォーマット: WAV
オーディオ ファイル名: example.wav
処理方法
トランスコードするオーディオの長さ: ビデオ全体
トランスコード完了通知: SMQ を使用
トランスコード後
オーディオ情報
オーディオ フォーマット: Opus
オーディオ構成: サンプリング レート 48 kHz、デュアル チャンネル
オーディオ ビットレート: 96 Kbit/s
ファイル ストレージ パス
Opus ファイル: oss://outbucket/outobject.opus
リクエスト例
// オーディオ ファイル example.wav をトランスコードします。
POST /example.wav?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
x-oss-async-process=audio/convert,f_opus,ab_96000,ar_48000,ac_2|sys/saveas,b_b3V0YnVja2V0, o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0OSS SDK の使用
オーディオ ファイルを非同期的にトランスコードするには、Java、Python、または Go の OSS SDK のみを使用できます。
Java
OSS SDK for Java V3.17.4 以降が必要です。
import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;
import java.util.Base64;
public class Demo {
public static void main(String[] args) throws ClientException {
// バケットが配置されているリージョンのエンドポイントを指定します。
String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
// バケットが配置されている Alibaba Cloud リージョンの ID を指定します。例: cn-hangzhou。
String region = "cn-hangzhou";
// 環境変数からアクセス認証情報を取得します。サンプル コードを実行する前に、OSS_ACCESS_KEY_ID 環境変数と OSS_ACCESS_KEY_SECRET 環境変数が構成されていることを確認してください。
EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
// バケットの名前を指定します。
String bucketName = "examplebucket";
// 出力オーディオの名前を指定します。
String targetKey = "dest.aac";
// ソース オーディオの名前を指定します。
String sourceKey = "src.mp3";
// OSSClient インスタンスを作成します。
ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
OSS ossClient = OSSClientBuilder.create()
.endpoint(endpoint)
.credentialsProvider(credentialsProvider)
.clientConfiguration(clientBuilderConfiguration)
.region(region)
.build();
try {
// 文字列型のスタイル変数を作成して、オーディオ トランスコード パラメーターを格納します。
String style = String.format("audio/convert,ss_10000,t_60000,f_aac,ab_96000");
// 非同期処理命令を作成します。
String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);
// AsyncProcessObjectRequest オブジェクトを作成します。
AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
// 非同期処理タスクを実行します。
AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
System.out.println("EventId: " + response.getEventId());
System.out.println("RequestId: " + response.getRequestId());
System.out.println("TaskId: " + response.getTaskId());
} finally {
// OSSClient インスタンスをシャットダウンします。
ossClient.shutdown();
}
}
}Python
OSS SDK for Python V2.18.4 以降が必要です。
# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider
def main():
# 環境変数からアクセス認証情報を取得します。サンプル コードを実行する前に、環境変数が構成されていることを確認してください。
auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())
# バケットが配置されているリージョンのエンドポイントを指定します。たとえば、バケットが中国 (杭州) リージョンに配置されている場合は、エンドポイントを https://oss-cn-hangzhou.aliyuncs.com に設定します。
endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
# バケットが配置されている Alibaba Cloud リージョンの ID を指定します。例: cn-hangzhou。
region = 'cn-hangzhou'
# バケットの名前を指定します。例: examplebucket。
bucket = oss2.Bucket(auth, endpoint, 'examplebucket', region=region)
# ソース オーディオの名前を指定します。
source_key = 'src.mp3'
# 出力オーディオの名前を指定します。
target_key = 'dest.aac'
# 文字列型の style 変数を作成して、オーディオ トランスコード パラメーターを格納します。
animation_style = 'audio/convert,ss_10000,t_60000,f_aac,ab_96000'
# 処理命令を作成します。バケット名と出力オブジェクト名は Base64 エンコードされています。
bucket_name_encoded = base64.urlsafe_b64encode('examplebucket'.encode()).decode().rstrip('=')
target_key_encoded = base64.urlsafe_b64encode(target_key.encode()).decode().rstrip('=')
process = f"{animation_style}|sys/saveas,b_{bucket_name_encoded},o_{target_key_encoded}/notify,topic_QXVkaW9Db252ZXJ0"
try:
# 非同期処理タスクを実行します。
result = bucket.async_process_object(source_key, process)
print(f"EventId: {result.event_id}")
print(f"RequestId: {result.request_id}")
print(f"TaskId: {result.task_id}")
except Exception as e:
print(f"Error: {e}")
if __name__ == "__main__":
main()Go
OSS SDK for Go V3.0.2 以降が必要です。
package main
import (
"encoding/base64"
"fmt"
"log"
"os"
"github.com/aliyun/aliyun-oss-go-sdk/oss"
)
func main() {
// 環境変数から一時的なアクセス認証情報を取得します。サンプル コードを実行する前に、OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、および OSS_SESSION_TOKEN 環境変数が構成されていることを確認してください。
provider, err := oss.NewEnvironmentVariableCredentialsProvider()
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// OSSClient インスタンスを作成します。
// バケットが配置されているリージョンのエンドポイントを指定します。たとえば、バケットが中国 (杭州) リージョンに配置されている場合は、エンドポイントを https://oss-cn-hangzhou.aliyuncs.com に設定します。実際のエンドポイントを指定してください。
// バケットが配置されている Alibaba Cloud リージョンの ID を指定します。例: cn-hangzhou。
client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// バケットの名前を指定します。例: examplebucket。
bucketName := "examplebucket"
bucket, err := client.Bucket(bucketName)
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// ソース オーディオの名前を指定します。
sourceKey := "src.mp3"
// 出力オーディオの名前を指定します。
targetKey := "dest.aac"
// 文字列型の animationStyle 変数を作成して、オーディオ トランスコード パラメーターを格納します。
animationStyle := "audio/convert,ss_10000,t_60000,f_aac,ab_96000"
// 処理命令を作成します。バケット名と出力オブジェクト名は Base64 エンコードされています。
bucketNameEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
targetKeyEncoded := base64.URLEncoding.EncodeToString([]byte(targetKey))
process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v/notify,topic_QXVkaW9Db252ZXJ0", animationStyle, bucketNameEncoded, targetKeyEncoded)
// 非同期処理タスクを実行します。
result, err := bucket.AsyncProcessObject(sourceKey, process)
if err != nil {
log.Fatalf("Failed to async process object: %s", err)
}
fmt.Printf("EventId: %s\n", result.EventId)
fmt.Printf("RequestId: %s\n", result.RequestId)
fmt.Printf("TaskId: %s\n", result.TaskId)
}