|
名稱 |
類型 |
描述 |
樣本值 |
|---|---|---|---|
|
object |
額外參數配置。 |
||
| BusinessUserId |
string |
作業關聯使用者識別碼。 |
16**** |
| Caller |
string |
調用方。 |
SilkFlow |
| Tags |
object |
自訂標籤。 |
|
|
string |
標籤。 |
key:value |
|
| PipelineId |
string |
工作流程 ID。 |
pid-12**** |
| EnableTideResource |
boolean |
允許任務使用潮汐資源。取值如下:
|
true |
| EnableErrorMonitoringInAIMaster |
boolean |
允許作業開啟容錯監控。取值如下:
|
false |
| ErrorMonitoringArgs |
string |
啟用容錯監控後,用於指定容錯監控的配置參數,比如指定是否啟動基於 log hang 的檢測。 |
--enable-log-hang-detection true |
| EnableRDMA |
boolean |
允許作業使用 RDMA。取值如下:
|
true |
| EnableOssAppend |
boolean |
是否允許 OSS 追加寫。取值如下:
|
true |
| OversoldType |
string |
作業的超賣資源使用方式(不接受/可接受/只接受)。 |
AcceptQuotaOverSold |
| AdvancedSettings |
object |
額外進階參數配置。 |
|
| Driver |
string |
NVIDIA 驅動配置。 |
535.54.03 |
| EnableSanityCheck |
boolean |
允許作業開啟算力健康檢測。取值如下:
|
true |
| SanityCheckArgs |
string |
算力健康檢測的配置參數。 |
--sanity-check-timing=AfterJobFaultTolerant --sanity-check-timeout-ops=MarkJobFail |
| JobReservedMinutes |
integer |
作業結束後保留的時間長度(分鐘)。 |
30 |
| JobReservedPolicy |
string |
作業結束後保留的策略。 |
Always |
| EnableCPUAffinity |
boolean |
CPU 親和性設定,僅在使用通用計算預付費資源時該設定有效 |
true |
| DisableEcsStockCheck |
boolean |
是否跳過庫存校正。取值如下:
|
false |
| AllocateAllRDMADevices |
boolean |
是否需要掛載全部 RDMA 網卡 |
|
| EnableDSWDev |
boolean |
||
| DataJuicerConfig | DataJuicerConfig |
DataJuicer 任務配置。 |
|
| ModelConfig | ModelConfig |
產出模型配置,該參數目前只在聯合訓練情境中生效 |
|
| AllowUnschedulableNodes |
boolean |