Gunakan komponen LLM-LaTeX Hapus Header (DLC) untuk memproses data teks TeX. Komponen ini menghapus konten sebelum bagian pertama yang sesuai dengan format <section-type>[optional-args]{name}. File data Object Storage Service (OSS) harus dalam format JSON Lines. Setiap baris dalam file adalah objek JSON yang valid, tetapi secara keseluruhan file tersebut bukan objek JSON yang valid. Klik di sini untuk melihat contoh.
Sumber daya komputasi yang didukung
Algoritma
Komponen ini menggunakan ekspresi reguler berikut untuk menemukan bagian-bagian dalam teks LaTeX: r'^(.*?)(\\\bchapter\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bpart\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsection\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsubsection\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsubsubsection\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bparagraph\b\*?(?:\[(.*?)\])?\{(.*?)\}|\\\bsubparagraph\b\*?(?:\[(.*?)\])?\{(.*?)\})'. Pola pencocokan dipisahkan oleh tanda garis vertikal (|).
Komponen ini menghapus semua konten sebelum bagian pertama yang ditemukan. Baris bagian dan konten berikutnya dipertahankan. Contoh:
Sebelum pemrosesan
| Setelah pemrosesan
|
Konfigurasikan komponen
Konfigurasikan parameter dari komponen LLM-LaTeX Remove Header (DLC) pada halaman pipeline di Machine Learning Designer di konsol Platform for AI (PAI). Tabel berikut menjelaskan parameter-parameter tersebut.
Tab | Parameter | Diperlukan | Deskripsi | Nilai default | |
Pengaturan Bidang | Bidang Proses Target | Ya | Nama bidang yang ingin Anda proses. | Tidak ada nilai default | |
Apakah Menghapus Sampel Tanpa Header | Tidak | Menentukan apakah akan menghapus sampel teks di mana tidak ada bagian yang ditemukan. | Terpilih | ||
Direktori OSS untuk Menyimpan OutputData | Tidak | Direktori OSS tempat data yang dihasilkan disimpan. Jika Anda tidak menentukan parameter ini, jalur default dari ruang kerja digunakan. | Tidak ada nilai default | ||
Pengaturan | Jumlah Proses | Tidak | Jumlah proses. | 8 | |
Pilih Grup Sumber Daya | Grup Sumber Daya Publik | Tidak | Tipe instans (CPU atau GPU), jumlah instans, dan virtual private cloud (VPC) yang ingin Anda gunakan. | Tidak ada nilai default | |
Grup sumber daya khusus | Tidak | Jumlah vCPU, memori, memori bersama, jumlah GPU, dan jumlah instans yang ingin Anda gunakan. | Tidak ada nilai default | ||
Durasi Maksimum Berjalan (detik) | Tidak | Periode waktu maksimum komponen dapat berjalan. Jika periode waktu ini terlampaui, pekerjaan dihentikan. | Tidak ada nilai default | ||

