全部產品
Search
文件中心

Object Storage Service:音頻轉碼

更新時間:May 27, 2025

您可以通過音頻轉碼功能,將音頻轉換為需要的格式。本文介紹音頻轉碼處理功能參數及樣本。

使用情境

  • 音樂檔案格式轉換:使用者下載的音樂可能不相容裝置,需要轉換格式才能播放。

  • 儲存空間最佳化:無損音頻佔用大量空間,使用者可將其轉碼為壓縮率高的有損格式(如MP3)以節省空間的。

  • 線上流媒體服務:線上平台將音頻轉碼為多種位元速率,以適應不同網路條件,保證在低頻寬下流暢收聽。

  • 視頻製作與後期處理:視頻編輯時,音頻素材需轉碼以匹配專案要求或適合網路傳播。

注意事項

  • 音頻轉碼僅支援非同步處理(x-oss-async-process處理方式)。

  • 使用音頻轉碼前需綁定IMM Project。Binder 方法請參見快速入門AttachOSSBucket - 綁定Object Storage Service桶

  • 不支援匿名訪問。

  • 必須擁有IMM處理所需的相關許可權。更多資訊,請參見許可權

  • 使用預設採樣率或聲道數轉碼時,可能因目標音頻容器相容性而失敗

  • 音頻轉碼不支援設定位深,視頻轉碼支援,通過OSS x-oss-processpixfmt參數設定參考視頻轉碼

參數說明

操作名稱:audio/convert

具體參數如下表所示。

參數

類型

是否必須

描述

ss

int

起始時間,單位為毫秒。取值:

  • 0(預設值):從起始位置開始。

  • 大於0:從第ss毫秒開始。

t

int

轉碼時間長度,單位為毫秒。取值:

  • 0(預設值):持續到結束位置。

  • 大於0:持續t毫秒。

f

string

音頻容器:

  • mp3

  • aac

  • flac

  • oga

  • ac3

  • opus

  • amr

ar

int

音頻採樣率。預設與源音頻一致,取值:

  • 8000

  • 11025

  • 12000

  • 16000

  • 22050

  • 24000

  • 32000

  • 44100

  • 48000

  • 64000

  • 88200

  • 96000

說明

不同格式支援的採樣率有所不同,mp3僅支援48kHz及以下;opus支援8kHz、12kHz、16kHz、24kHz與48kHz;ac3支援32kHz、44.1kHz與48kHz;amr僅支援8kHz與16kHz。

ac

int

音頻聲道數。預設與源音頻一致,取值範圍:1~8。

說明

不同格式支援的聲道數有所不同,mp3僅支援單、雙聲道;ac3最大支援6聲道(5.1);amr僅支援單聲道。

aq

int

音頻壓縮品質。與參數ab互斥。取值範圍:0~100。

ab

int

音頻位元速率(碼率)。與參數aq互斥,單位為位元/秒(bps)。取值範圍:1000~10000000。

abopt

string

音頻碼率選項。取值:

  • 0(預設值):始終使用目標音頻碼率。

  • 1:源音頻碼率小於ab時使用源音頻碼率。

  • 2:源音頻碼率小於ab時返回失敗。

adepth

int

音頻採樣位深,取值為16或24。

說明

該參數僅在f為flac時有效

說明

音頻轉碼時也會用到sys/saveasnotify參數。更多資訊,請參見另存新檔訊息通知

使用REST API

MP3轉AAC

轉碼資訊

  • 音頻格式:mp3 -> aac

  • 音頻名稱:example.mp3

  • 轉碼時間長度:從第1000毫秒開始,持續60000毫秒

  • 音頻配置:保持原有採樣率與聲道數,碼率96 Kbps

  • 轉碼完成訊息通知:發送MNS訊息

處理樣本

// 對檔案example.mp3進行音頻轉碼。
POST /example.mp3?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
 
x-oss-async-process=audio/convert,ss_10000,t_60000,f_aac,ab_96000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

WAV轉OPUS

轉碼資訊:

  • 音頻格式:wav -> opus

  • 轉碼時間長度:全部音頻

  • 音頻配置:採樣率48kHz,雙聲道,碼率96 Kbps

  • 檔案儲存體路徑:oss://outbucket/outobject.opus

  • 轉碼完成通知:發送MNS訊息

處理樣本

// 對檔案example.wav進行音頻轉碼。
POST /example.wav?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e
 
x-oss-async-process=audio/convert,f_opus,ab_96000,ar_48000,ac_2|sys/saveas,b_b3V0YnVja2V0, o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

使用SDK

僅支援使用Java、Python、Go SDK通過非同步處理的方式完成音頻轉碼。

Java

要求使用3.17.4及以上版本的Java SDK。

import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;

import java.util.Base64;

public class Demo {
    public static void main(String[] args) throws ClientException {
        // yourEndpoint填寫Bucket所在地區對應的Endpoint。
        String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
        // 填寫Endpoint對應的Region資訊,例如cn-hangzhou。
        String region = "cn-hangzhou";
        // 從環境變數中擷取訪問憑證。運行本程式碼範例之前,請確保已設定環境變數OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
        EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
        // 指定Bucket名稱。
        String bucketName = "examplebucket";
        // 指定轉碼後的音頻檔案。
        String targetKey = "dest.aac";
        // 指定原音頻檔案。
        String sourceKey = "src.mp3";

        // 建立OSSClient執行個體。
        // 當OSSClient執行個體不再使用時,調用shutdown方法以釋放資源。
        ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
        clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
        OSS ossClient = OSSClientBuilder.create()
                .endpoint(endpoint)
                .credentialsProvider(credentialsProvider)
                .clientConfiguration(clientBuilderConfiguration)
                .region(region)
                .build();

        try {
            // 構建音頻處理樣式字串以及音頻轉碼處理參數。
            String style = String.format("audio/convert,ss_10000,t_60000,f_aac,ab_96000");
            // 構建非同步處理指示。
            String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
            String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
            String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);
            // 建立AsyncProcessObjectRequest對象。
            AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
            // 執行非同步處理任務。
            AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
            System.out.println("EventId: " + response.getEventId());
            System.out.println("RequestId: " + response.getRequestId());
            System.out.println("TaskId: " + response.getTaskId());

        } finally {
            // 關閉OSSClient。
            ossClient.shutdown();
        }
    }
}

Python

要求使用Python SDK 2.18.4及以上版本。

# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider

def main():
    # 從環境變數中擷取訪問憑證。運行本程式碼範例之前,請先配置環境變數。
    auth = oss2.Auth(EnvironmentVariableCredentialsProvider())
    # 填寫Bucket所在地區對應的Endpoint。以華東1(杭州)為例,Endpoint填寫為https://oss-cn-hangzhou.aliyuncs.com。
    endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'

    # 指定Bucket名稱,例如examplebucket。
    bucket = oss2.Bucket(auth, endpoint, 'examplebucket')

    # 指定原音頻檔案名稱。
    source_key = 'src.mp3'

    # 指定轉碼後的音頻檔案。
    target_key = 'dest.aac'

    # 構建音頻處理樣式字串以及音頻轉碼處理參數。
    animation_style = 'audio/convert,ss_10000,t_60000,f_aac,ab_96000'

    # 構建處理指示,包括儲存路徑和Base64編碼的Bucket名稱和目標檔案名稱。
    bucket_name_encoded = base64.urlsafe_b64encode('examplebucket'.encode()).decode().rstrip('=')
    target_key_encoded = base64.urlsafe_b64encode(target_key.encode()).decode().rstrip('=')
    process = f"{animation_style}|sys/saveas,b_{bucket_name_encoded},o_{target_key_encoded}/notify,topic_QXVkaW9Db252ZXJ0"

    try:
        # 執行非同步處理任務。
        result = bucket.async_process_object(source_key, process)
        print(f"EventId: {result.event_id}")
        print(f"RequestId: {result.request_id}")
        print(f"TaskId: {result.task_id}")
    except Exception as e:
        print(f"Error: {e}")


if __name__ == "__main__":
    main()

Go

要求使用Go SDK 3.0.2及以上版本。

package main

import (
	"encoding/base64"
	"fmt"
	"log"
	"os"

	"github.com/aliyun/aliyun-oss-go-sdk/oss"
)

func main() {
	// 從環境變數中擷取臨時訪問憑證。運行本程式碼範例之前,請確保已設定環境變數OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、OSS_SESSION_TOKEN。
	provider, err := oss.NewEnvironmentVariableCredentialsProvider()
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 建立OSSClient執行個體。
	// yourEndpoint填寫Bucket對應的Endpoint,以華東1(杭州)為例,填寫為https://oss-cn-hangzhou.aliyuncs.com。其他Region請按實際情況填寫。
	// yourRegion指定阿里雲通用Region ID,例如cn-hangzhou。
	client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 指定Bucket名稱,例如examplebucket。
	bucketName := "examplebucket"

	bucket, err := client.Bucket(bucketName)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}

	// 指定原音頻檔案名稱。
	sourceKey := "src.mp3"
	// 指定轉碼後的音頻檔案
	targetKey := "dest.aac"

	// 構建音頻處理樣式字串以及音頻轉碼處理參數。
	animationStyle := "audio/convert,ss_10000,t_60000,f_aac,ab_96000"

	// 構建處理指示,包括儲存路徑和Base64編碼的Bucket名稱和目標檔案名稱。
	bucketNameEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
	targetKeyEncoded := base64.URLEncoding.EncodeToString([]byte(targetKey))
	process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v/notify,topic_QXVkaW9Db252ZXJ0", animationStyle, bucketNameEncoded, targetKeyEncoded)

	// 執行非同步處理任務。
	result, err := bucket.AsyncProcessObject(sourceKey, process)
	if err != nil {
		log.Fatalf("Failed to async process object: %s", err)
	}

	fmt.Printf("EventId: %s\n", result.EventId)
	fmt.Printf("RequestId: %s\n", result.RequestId)
	fmt.Printf("TaskId: %s\n", result.TaskId)
}