全部产品
Search
文档中心

Platform For AI:LLM-LaTeX Hapus Header (DLC)

更新时间:Jun 22, 2025

Gunakan komponen LLM-LaTeX Hapus Header (DLC) untuk memproses data teks TeX. Komponen ini menghapus konten sebelum bagian pertama yang sesuai dengan format <section-type>[optional-args]{name}. File data Object Storage Service (OSS) harus dalam format JSON Lines. Setiap baris dalam file adalah objek JSON yang valid, tetapi secara keseluruhan file tersebut bukan objek JSON yang valid. Klik di sini untuk melihat contoh.

Sumber daya komputasi yang didukung

DLC

Algoritma

Komponen ini menggunakan ekspresi reguler berikut untuk menemukan bagian-bagian dalam teks LaTeX: r'^(.*?)(\\\bchapter\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bpart\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsection\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsubsection\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsubsubsection\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bparagraph\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsubparagraph\b\*?(?:\[(.*?)\])?\{(.*?)\})'. Pola pencocokan dipisahkan oleh tanda garis vertikal (|).

Komponen ini menghapus semua konten sebelum bagian pertama yang ditemukan. Baris bagian dan konten berikutnya dipertahankan. Contoh:

Sebelum pemrosesan

image

Setelah pemrosesan

image

Konfigurasikan komponen

Konfigurasikan parameter dari komponen LLM-LaTeX Remove Header (DLC) pada halaman pipeline di Machine Learning Designer di konsol Platform for AI (PAI). Tabel berikut menjelaskan parameter-parameter tersebut.

Tab

Parameter

Diperlukan

Deskripsi

Nilai default

Pengaturan Bidang

Bidang Proses Target

Ya

Nama bidang yang ingin Anda proses.

Tidak ada nilai default

Apakah Menghapus Sampel Tanpa Header

Tidak

Menentukan apakah akan menghapus sampel teks di mana tidak ada bagian yang ditemukan.

Terpilih

Direktori OSS untuk Menyimpan OutputData

Tidak

Direktori OSS tempat data yang dihasilkan disimpan. Jika Anda tidak menentukan parameter ini, jalur default dari ruang kerja digunakan.

Tidak ada nilai default

Pengaturan

Jumlah Proses

Tidak

Jumlah proses.

8

Pilih Grup Sumber Daya

Grup Sumber Daya Publik

Tidak

Tipe instans (CPU atau GPU), jumlah instans, dan virtual private cloud (VPC) yang ingin Anda gunakan.

Tidak ada nilai default

Grup sumber daya khusus

Tidak

Jumlah vCPU, memori, memori bersama, jumlah GPU, dan jumlah instans yang ingin Anda gunakan.

Tidak ada nilai default

Durasi Maksimum Berjalan (detik)

Tidak

Periode waktu maksimum komponen dapat berjalan. Jika periode waktu ini terlampaui, pekerjaan dihentikan.

Tidak ada nilai default