LLM-Remove LaTeX Comment Lines (DLC) コンポーネントは、TeX 形式のテキストから行全体のコメントとインラインコメントの両方を削除します。入力 OSS データファイルは JSONL フォーマット (例) である必要があります。JSONL ファイルでは、各行が独立した JSON オブジェクトです。
サポート対象のコンピューティングリソース
アルゴリズム
このコンポーネントは、以下の正規表現を使用して LaTeX 形式のテキスト内のコメントを識別します。
|
コメントタイプ |
正規表現 |
|
行全体のコメント |
|
|
インラインコメント |
|
このコンポーネントは、これらの正規表現に一致するすべての文字列を検索し、空の文字列に置換します。以下の例に、この動作を示します。
|
処理前
|
処理後 [Current Field Value] ダイアログボックスでは、フィールドにクリーンアップされた LaTeX ソースコードが含まれており、これには次の行が含まれます: |
コンポーネントの設定
「Designer ワークフロー」ページで、[LLM-Remove LaTeX Comment Lines (DLC)] コンポーネントを追加し、右側のペインでそのパラメーターを設定します。
|
パラメータータイプ |
パラメーター |
必須 |
説明 |
デフォルト |
|
|
フィールド設定 |
処理対象のフィールド |
はい |
処理対象のフィールドです。 |
なし |
|
|
すべての行全体のコメントを削除 |
いいえ |
すべての行全体のコメントを削除するかどうかを指定します。 |
選択済み |
||
|
すべてのインラインコメントを削除 |
いいえ |
すべてのインラインコメントを削除するかどうかを指定します。 |
選択済み |
||
|
OSS 出力ディレクトリ |
いいえ |
出力データの OSS ディレクトリです。空の場合、コンポーネントはデフォルトのワークスペースパスを使用します。 |
なし |
||
|
実行チューニング |
プロセス数 |
いいえ |
ジョブの同時実行プロセス数です。 |
8 |
|
|
リソースグループの選択 |
パブリックリソースグループ |
いいえ |
ノード仕様 (CPU または GPU インスタンス仕様)、ノード数、および VPC を選択します。 |
なし |
|
|
専用リソースグループ |
いいえ |
CPU コア数、メモリ、共有メモリ、GPU 数、およびノード数を選択します。 |
なし |
||
|
最大実行時間 |
いいえ |
コンポーネントの最大実行時間です。この制限を超えると、ジョブは終了します。 |
なし |
||