すべてのプロダクト
Search
ドキュメントセンター

Object Storage Service:音声情報の抽出

最終更新日:Jun 28, 2025

音声情報の抽出機能を使用すると、音声サンプリングレート、音声チャンネル数、カバー画像の使用など、音声ファイルからメディアメタデータを抽出できます。

前提条件

OSS バケットが Intelligent Media Management (IMM) プロジェクトに関連付けられています。 OSS コンソールまたは OSS API を使用して、OSS バケットを IMM プロジェクトに関連付けることができます。

  • OSS コンソールで IMM プロジェクトを OSS バケットに関連付ける方法の詳細については、「はじめに」トピックの 手順 1: OSS バケットを IMM プロジェクトに関連付ける セクションをご参照ください。

  • API オペレーションを呼び出して IMM プロジェクトをバケットに関連付ける方法の詳細については、「AttachOSSBucket」をご参照ください。

使用上の注意

  • 音声情報の抽出は、同期処理 (x-oss-process) のみサポートしています。

  • 匿名アクセスはサポートされていません。

  • IMM に必要な 権限 が必要です。

パラメーター

操作: audio/info

音声情報は JSON 形式で返されます。

説明

レスポンスパラメーターの詳細については、「DetectMediaMeta」をご参照ください。

RESTful API の使用

FLAC ファイルのビデオ情報をクエリする

リクエストの例

// FLAC ファイルの例から音声情報を抽出します。
GET /exmaple.flac?x-oss-process=audio/info HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS4-HMAC-SHA256 Credential=LTAI********************/20250417/cn-hangzhou/oss/aliyun_v4_request,Signature=a7c3554c729d71929e0b84489addee6b2e8d5cb48595adfc51868c299c0c218e

レスポンスの例

HTTP/1.1 200 OK
Server: AliyunOSS
Date: Wed, 25 May 2022 12:43:57 GMT
Content-Type: application/json;charset=utf-8
Content-Length: 161
Connection: keep-alive
x-oss-request-id: 628E2481184E20F26C000009
x-oss-transfer-acc-type: acc-none
x-oss-data-location: oss-cn-hangzhou-a
ETag: "D0F162350DA037F4DC2A142B2E116BD0"
Last-Modified: Wed,
 25 May 2022 12:20:34 GMT
x-oss-object-type: Normal
x-oss-hash-crc64ecma: 2040549661341440100
x-oss-storage-class: Standard
x-oss-server-time: 12437

{
  "RequestId":"E63E1EFB-6D65-59DE-A11D-B0B761FDB301",
  "Album":"Album",
  "AlbumArtist":"Singer",
  "Bitrate":973219,
  "Duration":303.76,
  "FormatLongName":"raw FLAC",
  "FormatName":"flac",
  "StreamCount":3,
  "Title":"Song name"
  "AudioStreams":
  [
    {
      "ChannelLayout":"stereo",
      "Channels":2,
      "CodecLongName":"FLAC (Free Lossless Audio Codec)",
      "CodecName":"flac","CodecTag":"0x0000",
      "CodecTagString":"[0][0][0][0]",
      "Duration":303.76,
      "SampleFormat":"s16",
      "SampleRate":"44100",
      "TimeBase":"1/44100"
    }
  ],
  "VideoStreams":
  [
    {
      "AverageFrameRate":"0/0",
      "BitDepth":8,
      "CodecLongName":"Motion JPEG",
      "CodecName":"mjpeg",
      "CodecTag":"0x0000",
      "CodecTagString":"[0][0][0][0]",
      "ColorRange":"pc",
      "ColorSpace":"bt470bg",
      "Duration":303.76,
      "FrameRate":"90000/1",
      "Height":800,
      "Index":1,
      "Level":-99,
      "PixelFormat":"yuvj444p",
      "Profile":"Progressive",
      "Refs":1,
      "TimeBase":"1/90000",
      "Width":800
    },
    {
      "AverageFrameRate":"0/0",
      "BitDepth":8,
      "CodecLongName":"Motion JPEG",
      "CodecName":"mjpeg",
      "CodecTag":"0x0000",
      "CodecTagString":"[0][0][0][0]",
      "ColorRange":"pc",
      "ColorSpace":"bt470bg",
      "Duration":303.76,
      "FrameRate":"90000/1",
      "Height":800,
      "Index":2,
      "Level":-99,
      "PixelFormat":"yuvj444p",
      "Profile":"Progressive",
      "Refs":1,
      "TimeBase":"1/90000",
      "Width":800
    }
  ]
}

OSS SDK の使用

次のサンプルコードは、一般的なプログラミング言語の OSS SDK を使用して音声情報を抽出する方法の例を示しています。 他のプログラミング言語の SDK を使用して音声情報を抽出する場合は、次のサンプルコードに基づいてパラメーターを変更してください。

Java

OSS SDK for Java V3.17.4 以降が必要です。

import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.OSSObject;
import com.aliyun.oss.model.GetObjectRequest;
import com.aliyuncs.exceptions.ClientException;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.UnsupportedEncodingException;

public class Demo {
    public static void main(String[] args) throws ClientException, ClientException {
        // バケットが配置されているリージョンのエンドポイントを指定します。
        String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
        // バケットが格納されているバケットのリージョン ID を指定します。例: cn-hangzhou。
        String region = "cn-hangzhou";
        // 環境変数から認証情報を取得します。サンプルコードを実行する前に、OSS_ACCESS_KEY_ID および OSS_ACCESS_KEY_SECRET 環境変数が設定されていることを確認してください。
        EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
        // バケットの名前を指定します。
        String bucketName = "examplebucket";
        // 音声ファイルがバケットのルートディレクトリに保存されている場合は、音声ファイルの名前を指定します。音声ファイルがバケットのルートディレクトリに保存されていない場合は、音声ファイルのフルパスを指定する必要があります。例: exampledir/example.mp3。
        String key = "example.mp3";

        // OSSClient インスタンスを作成します。
        // OSSClient が不要になったら、shutdown メソッドを呼び出してリソースを解放します。
        ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
        clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
        OSS ossClient = OSSClientBuilder.create()
                .endpoint(endpoint)
                .credentialsProvider(credentialsProvider)
                .clientConfiguration(clientBuilderConfiguration)
                .region(region)
                .build();

        try {
            // 音声情報抽出命令を作成します。
            GetObjectRequest getObjectRequest = new GetObjectRequest(bucketName, key);
            getObjectRequest.setProcess("audio/info");

            // getObject メソッドの process パラメーターを使用して、処理命令を渡します。
            OSSObject ossObject = ossClient.getObject(getObjectRequest);

            // 音声情報を読み取って表示します。
            ByteArrayOutputStream baos = new ByteArrayOutputStream();
            byte[] buffer = new byte[1024];
            int bytesRead;
            while ((bytesRead = ossObject.getObjectContent().read(buffer)) != -1) {
                baos.write(buffer, 0, bytesRead);
            }
            String audioInfo = baos.toString("UTF-8");
            System.out.println("音声情報:");
            System.out.println(audioInfo);
        } catch (IOException e) {
            System.out.println("エラー: " + e.getMessage());
        } finally {
            // OSSClient インスタンスを停止します。
            ossClient.shutdown();
        }
    }
}

PHP

OSS SDK for PHP V2.7.0 以降が必要です。

<?php
if (is_file(__DIR__ . '/../autoload.php')) {
    require_once __DIR__ . '/../autoload.php';
}
if (is_file(__DIR__ . '/../vendor/autoload.php')) {
    require_once __DIR__ . '/../vendor/autoload.php';
}
use OSS\Credentials\EnvironmentVariableCredentialsProvider;
use OSS\OssClient;

try {
    // 環境変数から認証情報を取得します。サンプルコードを実行する前に、OSS_ACCESS_KEY_ID および OSS_ACCESS_KEY_SECRET 環境変数が設定されていることを確認してください。
    $provider = new EnvironmentVariableCredentialsProvider(); 
    // バケットが配置されているリージョンのエンドポイントを指定します。たとえば、バケットが中国 (杭州) リージョンにある場合は、エンドポイントを https://oss-cn-hangzhou.aliyuncs.com に設定します。
    $endpoint = 'https://oss-cn-hangzhou.aliyuncs.com';
    // バケットの名前を指定します。例: examplebucket。
    $bucket = 'examplebucket';
    // 音声ファイルがバケットのルートディレクトリに保存されている場合は、音声ファイルの名前を指定します。音声ファイルがバケットのルートディレクトリに保存されていない場合は、音声ファイルのフルパスを指定する必要があります。例: exampledir/example.mp3。
    $key = 'example.mp3'; 

    $config = array(
        "provider" => $provider,
        "endpoint" => $endpoint,        
        "signatureVersion" => OssClient::OSS_SIGNATURE_VERSION_V4,
        // バケットが配置されている Alibaba Cloud リージョンの ID を指定します。
        "region" => "cn-hangzhou"
    );
    $ossClient = new OssClient($config);
  // 音声情報の抽出命令を作成します。
  $options[$ossClient::OSS_PROCESS] = "audio/info";
  $result = $ossClient->getObject($bucket,$key,$options);
  var_dump($result);
} catch (OssException $e) {
  printf($e->getMessage() . "\n");
  return;
}

Python

OSS SDK for Python V2.18.4 以降が必要です。

# -*- coding: utf-8 -*-
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider

# 環境変数から認証情報を取得します。サンプルコードを実行する前に、OSS_ACCESS_KEY_ID および OSS_ACCESS_KEY_SECRET 環境変数が設定されていることを確認してください。
auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())

# バケットが配置されているリージョンのエンドポイントを指定します。たとえば、バケットが中国 (杭州) リージョンにある場合は、エンドポイントを https://oss-cn-hangzhou.aliyuncs.com に設定します。
endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
# バケットが配置されている Alibaba Cloud リージョンの ID を指定します。
region = 'cn-hangzhou'
bucket = oss2.Bucket(auth, endpoint, 'examplebucket', region=region)

# 音声ファイルがバケットのルートディレクトリに保存されている場合は、音声ファイルの名前を指定します。音声ファイルがバケットのルートディレクトリに保存されていない場合は、音声ファイルのフルパスを指定する必要があります。例: exampledir/example.mp3。
key = 'example.mp3'

# 音声情報の抽出命令を作成します。
process = 'audio/info'

try:
    # get_object メソッドを使用し、process パラメーターを使用して処理命令を渡します。
    result = bucket.get_object(key, process=process)

    # 音声情報を読み取って表示します。
    audio_info = result.read().decode('utf-8')
    print("Audio Info:")
    print(audio_info)
except oss2.exceptions.OssError as e:
    print("Error:", e)

Go

OSS SDK for Go V3.0.2 以降が必要です。

package main

import (
	"fmt"
	"io"
	"os"

	"github.com/aliyun/aliyun-oss-go-sdk/oss"
)

func main() {
	// 環境変数から一時的な認証情報を取得します。サンプルコードを実行する前に、OSS_ACCESS_KEY_ID および OSS_ACCESS_KEY_SECRET 環境変数が設定されていることを確認してください。
	provider, err := oss.NewEnvironmentVariableCredentialsProvider()
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// OSSClient インスタンスを作成します。
	// バケットが配置されているリージョンのエンドポイントを指定します。たとえば、バケットが中国 (杭州) リージョンにある場合は、エンドポイントを https://oss-cn-hangzhou.aliyuncs.com に設定します。実際のエンドポイントを指定してください。
	// バケットが配置されている Alibaba Cloud リージョンの ID を指定します。例: cn-hangzhou。
	client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// バケットの名前を指定します。例: examplebucket。
	bucketName := "examplebucket"

	bucket, err := client.Bucket(bucketName)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
        // 音声ファイルがバケットのルートディレクトリに保存されている場合は、音声ファイルの名前を指定します。音声ファイルがバケットのルートディレクトリに保存されていない場合は、音声ファイルのフルパスを指定する必要があります。例: exampledir/example.mp3。
        // oss.Process メソッドを使用して、音声情報の抽出命令を作成します。
	body, err := bucket.GetObject("example.mp3", oss.Process("audio/info"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}

	defer body.Close()

	data, err := io.ReadAll(body)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	fmt.Println("data:", string(data))
}