Object Storage Service (OSS) に保存されている音声ファイルを、非同期処理リクエストを使用して別のフォーマットに変換します。このトピックでは、パラメーターについて説明し、Java、Python、Go のコード例を示します。
前提条件
開始する前に、以下を確認してください。
Intelligent Media Management (IMM) プロジェクトにバインドされた OSS バケットです。設定手順については、「クイックスタート」および「AttachOSSBucket」をご参照ください。
音声トランスコードに必要な[権限]。
認証情報は環境変数として設定できます。 Java と Python は
OSS_ACCESS_KEY_IDとOSS_ACCESS_KEY_SECRETを使用します。 Go では、加えてOSS_SESSION_TOKENも必要です。
利用シーン
フォーマットの互換性:ターゲットデバイスやプレーヤーでサポートされているフォーマットに音声ファイルを変換します。
ストレージの最適化:FLAC や WAV などの可逆圧縮音声を MP3 などの非可逆圧縮フォーマットにトランスコーディングして、モバイルデバイスのストレージフットプリントを削減します。
メディアストリーミング:ソースファイルから複数のビットレートバージョンを生成し、さまざまなネットワーク条件下でのアダプティブストリーミングをサポートします。
ビデオの後処理:ビデオ編集ワークフロー中にオーディオトラックを圧縮フォーマットに変換し、転送効率を向上させます。
仕組み
x-oss-async-process ヘッダーを使用して非同期トランスコードリクエストを送信します。操作は audio/convert です。タスクが完了すると、OSS は sys/saveas で指定したパスに出力音声を保存します。
音声トランスコーディングは非同期のみであるため、同期画像処理で使用される x-oss-process ヘッダーはサポートされていません。
パラメーター
アクション: audio/convert
| パラメーター | タイプ | 必須 | 説明 |
|---|---|---|---|
f | string | はい | 出力コンテナフォーマット。サポートされる値:mp3、aac、flac、oga、ac3、opus、amr |
ss | int | いいえ | 開始時刻(ミリ秒単位)。0(デフォルト)は先頭から開始します。正の整数を指定すると、そのオフセット位置から開始します。 |
t | int | いいえ | 開始時刻以降の再生時間(ミリ秒単位)。0(デフォルト)は音声の最後まで再生します。 |
ar | int | いいえ | 出力音声のサンプルレート(Hz 単位)。デフォルトはソースのサンプルレートです。各フォーマットごとの制限については、「フォーマット制約」をご参照ください。サポートされる値:8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 |
ac | int | いいえ | 出力音声のチャンネル数。デフォルトはソースのチャンネル数です。有効な値:1~8。各フォーマットごとの制限については、「フォーマット制約」をご参照ください。 |
aq | int | いいえ | 音声圧縮品質。有効な値:0~100。ab とは相互排他的です。 |
ab | int | いいえ | 音声ビットレート(bit/s 単位)。有効な値:1000~10000000。aq とは相互排他的です。 |
abopt | string | いいえ | ソースのビットレートがターゲットより低い場合のビットレート動作。0(デフォルト):常にターゲットビットレートを使用します。1:ソースのビットレートを使用します。2:失敗として返します。 |
adepth | int | いいえ | 出力音声のサンプリングビット深度。有効な値:16、24。f=flac の場合にのみ適用されます。 |
sys/saveasを使用して出力パスを指定し、notifyを使用して完了通知を受信します。詳しくは、「sys/saveas」および「通知機能の使用」をご参照ください。
フォーマットの制約
異なる出力フォーマットでは、ar(サンプルレート)およびac(オーディオチャンネル)に追加の制限が課されます。デフォルトのサンプルレートまたはチャンネル数を使用した場合、ソース値とターゲットフォーマットとの互換性がなく、トランスコードが失敗する可能性があります。厳格な要件を持つフォーマットをターゲットにする場合は、arおよびacを明示的に設定してください。
| フォーマット | サポートされているサンプルレート | サポートされているオーディオチャンネル |
|---|---|---|
| MP3 | 最大 48 kHz | 1~2 |
| AAC | すべてのサポートされている値 | フォーマット固有の制限なし |
| FLAC | すべてのサポートされている値 | フォーマット固有の制限なし |
| OGA | すべてのサポートされている値 | フォーマット固有の制限なし |
| AC-3 | 32 kHz、44.1 kHz、48 kHz | 最大 6 (5.1) |
| Opus | 8 kHz、12 kHz、16 kHz、24 kHz、48 kHz | フォーマット固有の制限なし |
| AMR | 8 kHz、16 kHz | 1 |
制限事項
音声トランスコード中では、FLAC 出力(
adepthを使用)を除き、ビット深度の調整はサポートされていません。動画トラックのビット深度制御については、「動画トランスコード中」をご参照ください。匿名リクエストは拒否されます。認証が必要です。
Java、Python、Go の SDK のみが非同期音声トランスコーディングをサポートしています。
RESTful API の使用
すべての例では、x-oss-async-process ヘッダーを使用して非同期トランスコードタスクを送信します。
MP3 から AAC への変換
example.mp3 の 60 秒間のクリップを 1,000 ミリ秒の位置からトランスコードし、96 kbit/s の AAC で出力し、シンプルメッセージキュー (SMQ) 完了通知を送信します。
POST /example.mp3?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
x-oss-async-process=audio/convert,ss_10000,t_60000,f_aac,ab_96000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0WAV から Opus への変換
example.wav ファイル全体を、Message Notification Service (MNS) の完了通知付きで、48 kHz、デュアルチャンネル、96 kbit/s の Opus にトランスコードし、oss://outbucket/outobject.opus に保存します。
POST /example.wav?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
x-oss-async-process=audio/convert,f_opus,ab_96000,ar_48000,ac_2|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0OSS SDK の使用
Java
OSS SDK for Java V3.17.4 以降が必要です。
次の例では、src.mp3 を AAC フォーマットにトランスコードし、10 秒から開始して 60 秒の持続時間で、96 kbit/s のビットレートで処理し、結果を同じバケット内の dest.aac に保存します。
import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;
import java.util.Base64;
public class Demo {
public static void main(String[] args) throws ClientException {
// バケットが配置されているリージョンのエンドポイント
String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
// バケットのリージョン ID
String region = "cn-hangzhou";
// 環境変数 OSS_ACCESS_KEY_ID と OSS_ACCESS_KEY_SECRET から認証情報を読み込みます
EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
String bucketName = "examplebucket";
String targetKey = "dest.aac";
String sourceKey = "src.mp3";
ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
OSS ossClient = OSSClientBuilder.create()
.endpoint(endpoint)
.credentialsProvider(credentialsProvider)
.clientConfiguration(clientBuilderConfiguration)
.region(region)
.build();
try {
// トランスコーディングパラメーター:開始 10 秒、持続時間 60 秒、出力 AAC 96 kbit/s
String style = String.format("audio/convert,ss_10000,t_60000,f_aac,ab_96000");
// sys/saveas のためにバケット名と出力オブジェクトキーを Base64 エンコードします
String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);
AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
System.out.println("EventId: " + response.getEventId());
System.out.println("RequestId: " + response.getRequestId());
System.out.println("TaskId: " + response.getTaskId());
} finally {
ossClient.shutdown();
}
}
}Python
OSS SDK for Python V2.18.4 以降が必要です。
次の例では、src.mp3 を AAC フォーマットにトランスコードし、10 秒から開始して 60 秒の持続時間で、96 kbit/s のビットレートで処理し、結果を同じバケット内の dest.aac に保存します。
# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider
def main():
# 環境変数から認証情報を読み込みます
auth = oss2.Auth(EnvironmentVariableCredentialsProvider())
endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
bucket = oss2.Bucket(auth, endpoint, 'examplebucket')
source_key = 'src.mp3'
target_key = 'dest.aac'
# トランスコーディングパラメーター:開始 10 秒、持続時間 60 秒、出力 AAC 96 kbit/s
style = 'audio/convert,ss_10000,t_60000,f_aac,ab_96000'
# sys/saveas のためにバケット名と出力オブジェクトキーを Base64 エンコードします
bucket_name_encoded = base64.urlsafe_b64encode('examplebucket'.encode()).decode().rstrip('=')
target_key_encoded = base64.urlsafe_b64encode(target_key.encode()).decode().rstrip('=')
process = f"{style}|sys/saveas,b_{bucket_name_encoded},o_{target_key_encoded}/notify,topic_QXVkaW9Db252ZXJ0"
try:
result = bucket.async_process_object(source_key, process)
print(f"EventId: {result.event_id}")
print(f"RequestId: {result.request_id}")
print(f"TaskId: {result.task_id}")
except Exception as e:
print(f"Error: {e}")
if __name__ == "__main__":
main()Go
OSS SDK for Go V3.0.2 以降が必要です。
次の例では、src.mp3 を AAC フォーマットにトランスコードし、10 秒から開始して、持続時間は 60 秒、ビットレートは 96 kbit/s で、結果を同じバケット内の dest.aac に保存します。
package main
import (
"encoding/base64"
"fmt"
"log"
"os"
"github.com/aliyun/aliyun-oss-go-sdk/oss"
)
func main() {
// 環境変数 OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、OSS_SESSION_TOKEN から認証情報を読み込みます
provider, err := oss.NewEnvironmentVariableCredentialsProvider()
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// バケットのリージョン用の OSS クライアントを作成します
client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
bucketName := "examplebucket"
bucket, err := client.Bucket(bucketName)
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
sourceKey := "src.mp3"
targetKey := "dest.aac"
// トランスコーディングパラメーター:開始 10 秒、持続時間 60 秒、出力 AAC 96 kbit/s
style := "audio/convert,ss_10000,t_60000,f_aac,ab_96000"
// sys/saveas のためにバケット名と出力オブジェクトキーを Base64 エンコードします
bucketNameEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
targetKeyEncoded := base64.URLEncoding.EncodeToString([]byte(targetKey))
process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v/notify,topic_QXVkaW9Db252ZXJ0", style, bucketNameEncoded, targetKeyEncoded)
result, err := bucket.AsyncProcessObject(sourceKey, process)
if err != nil {
log.Fatalf("Failed to async process object: %s", err)
}
fmt.Printf("EventId: %s\n", result.EventId)
fmt.Printf("RequestId: %s\n", result.RequestId)
fmt.Printf("TaskId: %s\n", result.TaskId)
}次のステップ
sys/saveas — トランスコード出力を指定の OSS パスに保存する
通知機能を利用する — トランスコード完了時にコールバックを受信できます
ビデオトランスコーディング — ビデオファイルをトランスコーディングし、ビット深度などのパラメーターを調整します