全部产品
Search
文档中心

Platform For AI:Jenis file input dan output

更新时间:Nov 06, 2025

Di LangStudio, Anda dapat menggunakan variabel bertipe file untuk menerima dan mengeluarkan file serta memprosesnya menggunakan node penguraian dokumen atau node Python.

1. Input node awal

Pada node awal, Anda dapat mendefinisikan variabel input bertipe File untuk menerima file yang diunggah oleh pengguna sebagai input awal untuk alur kerja.

image

  • Berikut adalah jenis file yang didukung:

    • Jenis Dokumen: PDF, DOCX, PPTX, XLSX, XLS, TXT, MD, CSV, JSONL, HTML, dan HTM

    • Jenis Citra: JPG, JPEG, PNG, BMP, dan TIFF

    • Jenis Audio: MP3, WAV, dan AAC

    • Jenis Video: MP4, MOV, AVI, MKV, M4V, WMV, FLV, ASF, dan QT

  • Setelah mendefinisikan variabel bertipe file pada node awal, klik Parameter Configuration di panel percakapan. Anda dapat mengunggah file menggunakan salah satu dari dua metode: Upload From Local atau Enter URL. Saat menggunakan metode Enter URL, jenis file yang didukung meliputi hal-hal berikut:

    • OSS URI: Jalur penyimpanan file sesuai spesifikasi Alibaba Cloud OSS, seperti oss://bucket-name/path/to/file.pdf.

    • Tautan HTTP/HTTPS: Tautan yang dapat diunduh dan diakses melalui Internet, seperti https://example.com/file.docx.

    image

2. Pemrosesan file

Input bertipe file dapat diproses menggunakan node penguraian dokumen atau node Python.

2.1. Node penguraian dokumen

Untuk informasi lebih lanjut, lihat Penguraian Dokumen.

2.2. Penggunaan kustom dalam node Python

Dalam node Python, Anda dapat mereferensikan variabel bertipe file sebagai input node atau menghasilkan objek bertipe file sebagai output node.

Catatan

File adalah tipe inti yang digunakan LangStudio untuk merepresentasikan file. Anda harus mengimpor paket dependensi menggunakan from langstudio.types import File.

LangStudio menyediakan beberapa metode untuk membuat objek bertipe File dan mengunggahnya ke jalur penyimpanan OSS Anda.

Konstruksi langsung

Buat langsung objek File. Ini adalah metode konstruksi paling dasar dan cocok untuk mereferensikan file yang sudah ada.

Parameter

Tipe

Deskripsi

Nilai contoh

source_uri

str

Wajib. Lokasi asli file. Format berikut didukung:

  • URL HTTP/HTTPS: https://example.com/doc.pdf

  • OSS URI: oss://my-bucket/path/file.txt

  • Jalur lokal file di jalur mount kontainer.

"https://files.example.com/report.pdf"

download_url

str, opsional

Tautan HTTP/HTTPS yang dapat diunduh.

  • Jika parameter ini tidak diberikan, sistem akan secara otomatis menghasilkan tautan.

  • Jika sumbernya adalah OSS URI, URL yang ditandatangani yang valid selama tujuh hari akan dihasilkan. Jika tautan kedaluwarsa, Anda dapat memanggil File.get_download_url() untuk memperbarui dan mendapatkan URL yang ditandatangani terbaru.

"https://oss-cn-beijing.aliyuncs.com/my-bucket/...?Expires=...&OSSAccessKeyId=..."

file_id

str, opsional

Pengenal unik file. Jika parameter ini tidak diberikan, sistem akan menghasilkan pengenal unik universal (UUID) sepanjang 8 digit.

"a1b2c3d4"

file_name

str, opsional

Nama file. Jika parameter ini tidak diberikan, sistem akan secara otomatis menafsirkannya dari source_uri.

"annual_summary_report.docx"

file_type

str, opsional

Tipe Multipurpose Internet Mail Extensions (MIME) dari file, seperti application/pdf. Jika parameter ini tidak diberikan, sistem akan secara otomatis menafsirkannya berdasarkan ekstensi nama file.

"application/vnd.openxmlformats-officedocument.wordprocessingml.document"

Kode Contoh:

from langstudio.types import File
file = File(source_uri="https://example.com/report.pdf")
file = File(source_uri="oss://my-bucket/docs/file.docx")

Konstruksi dari string

Metode File.from_content() memungkinkan Anda membuat objek bertipe File dari konten string. Metode ini cocok untuk menghasilkan file teks, seperti file Markdown, TXT, dan CSV.

Parameter

Tipe

Deskripsi

Nilai contoh

content

str

Wajib. Konten string yang akan disimpan. Konten tersebut dienkod menggunakan UTF-8 sebelum diunggah.

"# Generate Report\nThis content is automatically generated by the system."

file_name

str

Wajib. Nama file yang dihasilkan.

"report.md"

Kode Contoh:

from langstudio.types import File
content = "# Generate Report\nThis content is automatically generated by the system."
file = File.from_content(content=content, file_name="report.md")

Konstruksi dari urutan byte

Metode File.from_bytes(content, file_name) memungkinkan Anda membuat objek bertipe File dari urutan byte. Metode ini cocok untuk memproses file biner, seperti file PDF, citra, dan dokumen Office.

Parameter

Tipe

Deskripsi

Nilai contoh

content

bytes

Wajib. Data biner yang akan disimpan.

b"%PDF-1.4\n1 0 obj\n<< /Type /Catalog >>\nendobj\n"

file_name

str

Wajib. Nama file yang dihasilkan.

"test.pdf"

Kode Contoh:

from langstudio.types import File
# Asumsikan bahwa pdf_data adalah objek bytes
file = File.from_bytes(content=pdf_data, file_name="test.pdf")

Konstruksi dari file lokal

Metode File.from_local_file(local_path, file_name) memungkinkan Anda mengunggah file lokal dari jalur mount dan membuat objek bertipe File. Metode ini cocok untuk file lokal di dalam kontainer.

Parameter

Tipe

Deskripsi

Nilai contoh

local_path

str

Wajib. Jalur di sistem file lokal.

"/tmp/report.docx"

file_name

str, opsional

Nama file yang dihasilkan. Jika parameter ini tidak diberikan, nama file di local_path digunakan.

"final_report.docx"

Kode Contoh:

from langstudio.types import File
# Asumsikan bahwa file sudah ada di folder /tmp/
file = File.from_local_file(local_path="/tmp/output.pptx", file_name="presentation.pptx")

Konstruksi dari aliran data

Metode File.from_stream(stream, file_name) memungkinkan Anda mengunggah konten dari aliran data, seperti aliran jaringan, BytesIO, atau objek iterable, dan membuat objek File. Metode ini cocok untuk file besar atau pemrosesan aliran.

Parameter

Tipe

Deskripsi

Nilai contoh

stream

str | bytes | BinaryIO | Iterator[bytes]

Wajib. Sumber data. Bisa berupa:

  • String URL HTTP/HTTPS

  • Objek bytes

  • Aliran io.BytesIO

  • Objek requests.Response (dengan stream=True)

  • Objek byte iterable apa pun

"https://example.com/large-video.mp4"

file_name

str

Wajib. Nama file yang dihasilkan.

"downloaded_video.mp4"

Kode Contoh:

import io
from langstudio.types import File

url = "https://example.com/data.jsonl"
file = File.from_stream(stream=url, file_name="data.jsonl")

3. Output node akhir

Pada node akhir, Anda dapat menggunakan objek bertipe File sebagai output alur kerja. Untuk melihat output, klik "Lihat output lainnya" di panel percakapan untuk melihat dan mengunduh file output alur kerja.

image

image

image

4. Catatan izin

Operasi yang melibatkan tipe File memerlukan akses baca dan tulis ke bucket OSS. Saat Anda membuat runtime dan menerapkan alur aplikasi, perhatikan hal-hal berikut:

  • Pilih jalur kerja ruang kerja default sebagai jalur kerja saat ini.

  • Untuk Instance RAM Role, kami sarankan Anda memilih PAI Default Role. Jika Anda memilih Custom Role, Anda harus memberikan izin AliyunOSSFullAccess kepada peran kustom tersebut. Jika tidak, LangStudio tidak dapat melakukan operasi input dan output file.

Untuk melihat jalur ruang kerja default, lihat gambar berikut:

image

Buat runtime:

image

Terapkan alur aplikasi:

image