LLM-LaTeX Expand Macro コンポーネントは、大規模言語モデル (LLM) 向けに TeX フォーマットのテキストを前処理します。その主な機能は、名前が英数字のみで構成されるパラメーターなしのマクロを、その名前を値に置き換えることで展開することです。
サポートされるコンピューティングリソース
仕組み
LLM-LaTeX Expand Macro コンポーネントは、以下の正規表現を使用して、パラメーターなしのマクロをインラインで展開します。
|
項目 |
パラメーターなしの \newcommand マクロ |
パラメーターなしの \def マクロ |
|
正規表現 |
|
|
|
正規表現に一致する内容 |
|
|
|
説明 |
`macro_name` には英数字のみを含めることができます。 `macro_value` には任意の文字を含めることができます。 |
|
コンポーネントは、上記の正規表現に一致するすべての文字列を抽出し、`macro_name` を `macro_value` に置き換えます。 以下に例を示します。
|
処理前
|
処理後 処理後、
|
コンポーネントの設定
Designer で、LLM-LaTeX Expand Macro コンポーネントをパイプラインに追加します。 次に、右側のペインでパラメーターを設定します。
|
パラメーターグループ |
パラメーター |
説明 |
|
フィールド設定 |
処理する列の選択 |
処理する 1 つ以上の列を選択します。 |
|
出力テーブルのライフサイクル |
一時テーブルのライフサイクルを日数で指定します。 この期間が経過すると、テーブルは削除されます。 値は正の整数である必要があります。 デフォルト: 28。 |
|
|
チューニング |
インスタンスあたりの CPU 数 |
各マップタスクインスタンスの CPU リソース。 値 100 は 1 vCPU を表します。 範囲: 50~800。 デフォルト: 100。 |
|
インスタンスあたりのメモリサイズ (MB) |
各マップタスクインスタンスのメモリ (MB)。 範囲: 256~12288。 デフォルト: 1024。 |
|
|
インスタンスあたりのデータサイズ (MB) |
各マップタスクインスタンスが処理できる最大データサイズ (MB)。 範囲: 1 から `Integer.MAX_VALUE` まで。 デフォルト: 256。 このパラメーターは、マップタスクの入力データサイズを制御します。 |