すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:ファイルタイプの入力と出力

最終更新日:Nov 06, 2025

LangStudio では、ファイルタイプの変数を使用してファイルの受け入れと出力を行い、ドキュメント解析ノードまたは Python ノードを使用してそれらを処理できます。

1. 開始ノードの入力

[開始ノード] では、ファイルタイプの入力変数を定義して、ユーザーがアップロードしたファイルをワークフローの初期入力として受け入れることができます。

image

  • サポートされているファイルタイプは次のとおりです。

    • ドキュメントタイプ: PDF、DOCX、PPTX、XLSX、XLS、TXT、MD、CSV、JSONL、HTML、および HTM

    • 画像タイプ: JPG、JPEG、PNG、BMP、および TIFF

    • 音声タイプ: MP3、WAV、および AAC

    • 動画タイプ: MP4、MOV、AVI、MKV、M4V、WMV、FLV、ASF、および QT

  • 開始ノードでファイルタイプの変数を定義した後、会話パネルで [パラメーター設定] をクリックします。ファイルをアップロードするには、[ローカルからアップロード] または [URL を入力] の 2 つの方法があります。[URL を入力] メソッドを使用する場合、サポートされているファイルタイプは次のとおりです。

    • OSS URI: Alibaba Cloud OSS の仕様に準拠したファイルストレージパス。例: oss://bucket-name/path/to/file.pdf

    • HTTP/HTTPS リンク: インターネット経由でアクセスできるダウンロード可能なリンク。例: https://example.com/file.docx

    image

2. ファイル処理

ファイルタイプの入力は、ドキュメント解析ノードまたは Python ノードを使用して処理できます。

2.1. ドキュメント解析ノード

詳細については、「ドキュメント解析」をご参照ください。

2.2. Python ノードでのカスタム使用

Python ノードでは、ファイルタイプの変数をノード入力として参照したり、ファイルタイプのオブジェクトをノード出力として生成したりできます。

説明

File は LangStudio がファイルを表すために使用するコアタイプです。依存関係パッケージを from langstudio.types import File を使用してインポートする必要があります。

LangStudio は、File 型オブジェクトを構築し、OSS ストレージパスにアップロードするための複数のメソッドを提供します。

直接構築

File オブジェクトを直接作成します。これは最も基本的な構築メソッドであり、既存のファイルを参照するのに適しています。

パラメーター

タイプ

説明

値の例

source_uri

str

必須。ファイルの元の場所。次のフォーマットがサポートされています:

  • HTTP/HTTPS URL: https://example.com/doc.pdf

  • OSS URI: oss://my-bucket/path/file.txt

  • コンテナーマウントパス内のファイルのローカルパス。

"https://files.example.com/report.pdf"

download_url

str, optional

ダウンロード可能な HTTP/HTTPS リンク。

  • このパラメーターが指定されていない場合、システムは自動的にリンクを生成します。

  • ソースが OSS URI の場合、7 日間有効な署名付き URL が生成されます。リンクの有効期限が切れた場合は、File.get_download_url() を呼び出して更新し、最新の署名付き URL を取得できます。

"https://oss-cn-beijing.aliyuncs.com/my-bucket/...?Expires=...&OSSAccessKeyId=..."

file_id

str, optional

ファイルの一意の識別子。このパラメーターが指定されていない場合、システムは 8 桁の汎用一意識別子 (UUID) を生成します。

"a1b2c3d4"

file_name

str, optional

ファイル名。このパラメーターが指定されていない場合、システムは source_uri から自動的に推測します。

"annual_summary_report.docx"

file_type

str, optional

ファイルの Multipurpose Internet Mail Extensions (MIME) タイプ。例: application/pdf。このパラメーターが指定されていない場合、システムはファイル名拡張子に基づいて自動的に推測します。

"application/vnd.openxmlformats-officedocument.wordprocessingml.document"

サンプルコード:

from langstudio.types import File
file = File(source_uri="https://example.com/report.pdf")
file = File(source_uri="oss://my-bucket/docs/file.docx")

文字列からの構築

File.from_content() メソッドを使用すると、文字列コンテンツから File 型オブジェクトを作成できます。このメソッドは、Markdown、TXT、CSV ファイルなどのテキストファイルの生成に適しています。

パラメーター

タイプ

説明

値の例

content

str

必須。保存する文字列コンテンツ。コンテンツはアップロードされる前に UTF-8 でエンコードされます。

"# Generate Report\nThis content is automatically generated by the system."

file_name

str

必須。生成されるファイルの名前。

"report.md"

サンプルコード:

from langstudio.types import File
content = "# Generate Report\nThis content is automatically generated by the system."
file = File.from_content(content=content, file_name="report.md")

バイトシーケンスからの構築

File.from_bytes(content, file_name) メソッドを使用すると、バイトシーケンスから File 型オブジェクトを作成できます。このメソッドは、PDF ファイル、画像、Office ドキュメントなどのバイナリファイルの処理に適しています。

パラメーター

タイプ

説明

値の例

content

bytes

必須。保存するバイナリデータ。

b"%PDF-1.4\n1 0 obj\n<< /Type /Catalog >>\nendobj\n"

file_name

str

必須。生成されるファイルの名前。

"test.pdf"

サンプルコード:

from langstudio.types import File
# Assume that pdf_data is a bytes object
file = File.from_bytes(content=pdf_data, file_name="test.pdf")

ローカルファイルからの構築

File.from_local_file(local_path, file_name) メソッドを使用すると、マウントパスからローカルファイルをアップロードし、File 型オブジェクトを作成できます。このメソッドは、コンテナー内のローカルファイルに適しています。

パラメーター

タイプ

説明

値の例

local_path

str

必須。ローカルファイルシステム内のパス。

"/tmp/report.docx"

file_name

str, optional

生成されるファイルの名前。このパラメーターが指定されていない場合は、local_path のファイル名が使用されます。

"final_report.docx"

サンプルコード:

from langstudio.types import File
# Assume that the file already exists in the /tmp/ folder
file = File.from_local_file(local_path="/tmp/output.pptx", file_name="presentation.pptx")

データストリームからの構築

File.from_stream(stream, file_name) メソッドを使用すると、ネットワークストリーム、BytesIO、または反復可能なオブジェクトなどのデータストリームからコンテンツをアップロードし、File オブジェクトを作成できます。このメソッドは、大きなファイルやストリーム処理に適しています。

パラメーター

タイプ

説明

値の例

stream

str | bytes | BinaryIO | Iterator[bytes]

必須。データソース。次のいずれかを指定できます:

  • HTTP/HTTPS URL 文字列

  • bytes オブジェクト

  • io.BytesIO ストリーム

  • requests.Response オブジェクト (stream=True の場合)

  • 任意の反復可能なバイトオブジェクト

"https://example.com/large-video.mp4"

file_name

str

必須。生成されるファイルの名前。

"downloaded_video.mp4"

サンプルコード:

import io
from langstudio.types import File

url = "https://example.com/data.jsonl"
file = File.from_stream(stream=url, file_name="data.jsonl")

3. 終了ノードの出力

終了ノードでは、File 型オブジェクトをワークフローの出力として使用できます。出力を表示するには、会話パネルで「他の出力を表示」をクリックして、ワークフローの出力ファイルを表示およびダウンロードします。

image

image

image

4. 権限に関する注意事項

File 型を含む操作には、OSS バケットへの読み取りおよび書き込みアクセス権が必要です。ランタイムを作成してアプリケーションフローをデプロイする際には、次の点に注意してください。

  • 現在の作業パスとしてデフォルトのワークスペースパスを選択します。

  • [インスタンス RAM ロール] には、[PAI デフォルトロール] を選択することをお勧めします。[カスタムロール] を選択した場合は、カスタムロールに AliyunOSSFullAccess 権限を付与する必要があります。そうしないと、LangStudio はファイルの入出力操作を実行できません。

デフォルトのワークスペースパスを表示するには、次の図をご参照ください。

image

ランタイムの作成:

image

アプリケーションフローのデプロイ:

image