Di LangStudio, Anda dapat menggunakan variabel bertipe file untuk menerima dan mengeluarkan file serta memprosesnya menggunakan node penguraian dokumen atau node Python.
1. Input node awal
Pada node awal, Anda dapat mendefinisikan variabel input bertipe File untuk menerima file yang diunggah oleh pengguna sebagai input awal untuk alur kerja.

Berikut adalah jenis file yang didukung:
Jenis Dokumen: PDF, DOCX, PPTX, XLSX, XLS, TXT, MD, CSV, JSONL, HTML, dan HTM
Jenis Citra: JPG, JPEG, PNG, BMP, dan TIFF
Jenis Audio: MP3, WAV, dan AAC
Jenis Video: MP4, MOV, AVI, MKV, M4V, WMV, FLV, ASF, dan QT
Setelah mendefinisikan variabel bertipe file pada node awal, klik Parameter Configuration di panel percakapan. Anda dapat mengunggah file menggunakan salah satu dari dua metode: Upload From Local atau Enter URL. Saat menggunakan metode Enter URL, jenis file yang didukung meliputi hal-hal berikut:
OSS URI: Jalur penyimpanan file sesuai spesifikasi Alibaba Cloud OSS, seperti
oss://bucket-name/path/to/file.pdf.Tautan HTTP/HTTPS: Tautan yang dapat diunduh dan diakses melalui Internet, seperti
https://example.com/file.docx.

2. Pemrosesan file
Input bertipe file dapat diproses menggunakan node penguraian dokumen atau node Python.
2.1. Node penguraian dokumen
Untuk informasi lebih lanjut, lihat Penguraian Dokumen.
2.2. Penggunaan kustom dalam node Python
Dalam node Python, Anda dapat mereferensikan variabel bertipe file sebagai input node atau menghasilkan objek bertipe file sebagai output node.
File adalah tipe inti yang digunakan LangStudio untuk merepresentasikan file. Anda harus mengimpor paket dependensi menggunakan from langstudio.types import File.
LangStudio menyediakan beberapa metode untuk membuat objek bertipe File dan mengunggahnya ke jalur penyimpanan OSS Anda.
Konstruksi langsung
Buat langsung objek File. Ini adalah metode konstruksi paling dasar dan cocok untuk mereferensikan file yang sudah ada.
Parameter | Tipe | Deskripsi | Nilai contoh |
|
| Wajib. Lokasi asli file. Format berikut didukung:
|
|
|
| Tautan HTTP/HTTPS yang dapat diunduh.
|
|
|
| Pengenal unik file. Jika parameter ini tidak diberikan, sistem akan menghasilkan pengenal unik universal (UUID) sepanjang 8 digit. |
|
|
| Nama file. Jika parameter ini tidak diberikan, sistem akan secara otomatis menafsirkannya dari |
|
|
| Tipe Multipurpose Internet Mail Extensions (MIME) dari file, seperti |
|
Kode Contoh:
from langstudio.types import File
file = File(source_uri="https://example.com/report.pdf")
file = File(source_uri="oss://my-bucket/docs/file.docx")Konstruksi dari string
Metode File.from_content() memungkinkan Anda membuat objek bertipe File dari konten string. Metode ini cocok untuk menghasilkan file teks, seperti file Markdown, TXT, dan CSV.
Parameter | Tipe | Deskripsi | Nilai contoh |
|
| Wajib. Konten string yang akan disimpan. Konten tersebut dienkod menggunakan UTF-8 sebelum diunggah. |
|
|
| Wajib. Nama file yang dihasilkan. |
|
Kode Contoh:
from langstudio.types import File
content = "# Generate Report\nThis content is automatically generated by the system."
file = File.from_content(content=content, file_name="report.md")Konstruksi dari urutan byte
Metode File.from_bytes(content, file_name) memungkinkan Anda membuat objek bertipe File dari urutan byte. Metode ini cocok untuk memproses file biner, seperti file PDF, citra, dan dokumen Office.
Parameter | Tipe | Deskripsi | Nilai contoh |
|
| Wajib. Data biner yang akan disimpan. |
|
|
| Wajib. Nama file yang dihasilkan. |
|
Kode Contoh:
from langstudio.types import File
# Asumsikan bahwa pdf_data adalah objek bytes
file = File.from_bytes(content=pdf_data, file_name="test.pdf")Konstruksi dari file lokal
Metode File.from_local_file(local_path, file_name) memungkinkan Anda mengunggah file lokal dari jalur mount dan membuat objek bertipe File. Metode ini cocok untuk file lokal di dalam kontainer.
Parameter | Tipe | Deskripsi | Nilai contoh |
|
| Wajib. Jalur di sistem file lokal. |
|
|
| Nama file yang dihasilkan. Jika parameter ini tidak diberikan, nama file di |
|
Kode Contoh:
from langstudio.types import File
# Asumsikan bahwa file sudah ada di folder /tmp/
file = File.from_local_file(local_path="/tmp/output.pptx", file_name="presentation.pptx")Konstruksi dari aliran data
Metode File.from_stream(stream, file_name) memungkinkan Anda mengunggah konten dari aliran data, seperti aliran jaringan, BytesIO, atau objek iterable, dan membuat objek File. Metode ini cocok untuk file besar atau pemrosesan aliran.
Parameter | Tipe | Deskripsi | Nilai contoh |
|
| Wajib. Sumber data. Bisa berupa:
|
|
|
| Wajib. Nama file yang dihasilkan. |
|
Kode Contoh:
import io
from langstudio.types import File
url = "https://example.com/data.jsonl"
file = File.from_stream(stream=url, file_name="data.jsonl")3. Output node akhir
Pada node akhir, Anda dapat menggunakan objek bertipe File sebagai output alur kerja. Untuk melihat output, klik "Lihat output lainnya" di panel percakapan untuk melihat dan mengunduh file output alur kerja.



4. Catatan izin
Operasi yang melibatkan tipe File memerlukan akses baca dan tulis ke bucket OSS. Saat Anda membuat runtime dan menerapkan alur aplikasi, perhatikan hal-hal berikut:
Pilih jalur kerja ruang kerja default sebagai jalur kerja saat ini.
Untuk Instance RAM Role, kami sarankan Anda memilih PAI Default Role. Jika Anda memilih Custom Role, Anda harus memberikan izin
AliyunOSSFullAccesskepada peran kustom tersebut. Jika tidak, LangStudio tidak dapat melakukan operasi input dan output file.
Untuk melihat jalur ruang kerja default, lihat gambar berikut:

Buat runtime:

Terapkan alur aplikasi:
