全部产品
Search
文档中心

Platform For AI:Laporan Optimisasi

更新时间:Jun 22, 2025

Setelah mengoptimalkan model menggunakan Machine Learning Platform for AI (PAI)-Blade, sistem akan menghasilkan laporan optimisasi. Topik ini menjelaskan struktur dan parameter laporan tersebut.

Setelah memanggil metode blade.optimize untuk mengoptimalkan model, laporan optimisasi dihasilkan dalam format JSON. Contoh kode berikut menunjukkan struktur laporan optimisasi:
Report: {
  // Informasi lingkungan perangkat lunak, termasuk framework dan Compute Unified Device Architecture (CUDA). 
  "software_context": [
    {
      "software": "tensorflow",
      "version": "1.15.0"
    },
    {
      "software": "cuda",
      "version": "9.0.176"
    }
  ],
  // Informasi lingkungan perangkat keras. 
  "hardware_context": {
    "device_type": "gpu",
    "microarchitecture": "T4"
  },
  "user_config": "",
  // Informasi diagnosis. 
  "diagnosis": {
    "model": "tmp_graph.pbtxt",           
    "test_data_source": "user provided",  
    "shape_variation": "dynamic",         
    "message": "",
    "test_data_info": "input_ids_a_1:0 shape: (1, 9.240) tipe data: int32"
  },
  // Item optimisasi yang mencapai efek optimisasi. 
  "optimizations": [
    {
      "name": "TfStripUnusedNodes", 
      "status": "effective",        
      "speedup": "na",              
      "pre_run": "na",              
      "post_run": "na"              
    },
    {
      "name": "TfAutoMixedPrecisionGpu",
      "status": "effective",
      "speedup": "1,42",
      "pre_run": "9,35 ms",
      "post_run": "6,59 ms"
    }
  ],
  // Hasil optimisasi end-to-end. 
  "overall": {
    "baseline": "10,00 ms",   
    "optimized": "4,38 ms",   
    "speedup": "2,28"         
  },
  // Informasi model. 
  "model_info": {
    "input_format": "frozen_pb"  
  },
  
  // Informasi kompatibilitas. 
  "compatibility_list": [
    {
      "device_type": "gpu",
      "microarchitecture": "T4"
    }
  ],
  "model_sdk": {}
}
Tabel berikut menjelaskan parameter dalam laporan optimisasi.
ParameterDeskripsi
software_contextInformasi lingkungan perangkat lunak, termasuk framework dan CUDA.
hardware_contextInformasi lingkungan perangkat keras, termasuk jenis perangkat dan spesifikasi.
user_configInformasi konfigurasi pengguna. Dalam laporan optimisasi yang dihasilkan oleh PAI-Blade, parameter ini dibiarkan kosong.
diagnosismodelNama file model.
test_data_sourceSumber data uji. Nilai valid:
  • user provided: Data uji disediakan oleh pengguna.
  • blade deduced: Data uji diinferensi oleh PAI-Blade.
shape_variationVariasi bentuk input. Nilai valid:
  • static
  • multiple_static_shapes
  • dynamic
messagePesan kesalahan yang dikembalikan jika PAI-Blade gagal menginferensi data uji.
test_data_infoInformasi tentang data uji, termasuk bentuk dan tipe data.
optimizationsnameNama item optimisasi.
statusMenunjukkan apakah optimisasi berpengaruh. Nilai valid:
  • effective: Optimisasi berpengaruh.
  • ineffective: Optimisasi tidak berpengaruh.
speedupRasio percepatan, yang dihitung dengan menggunakan rumus berikut: speedup = pre_run/post_run.
pre_runKecepatan sebelum optimisasi.
post_runKecepatan setelah optimisasi.
overallbaselineLatensi sebelum percepatan.
optimizedLatensi setelah percepatan.
speedupRasio percepatan, yang dihitung dengan menggunakan rumus berikut: speedup = baseline/optimized.
model_infoinput_formatFormat model asli.
compatibility_listInformasi kompatibilitas. Untuk memastikan bahwa model yang dioptimalkan dapat dijalankan dengan benar dan memberikan kinerja yang diharapkan, Anda harus menjalankan model pada perangkat yang dijelaskan dalam informasi kompatibilitas.
model_sdkInformasi SDK tambahan yang diperlukan untuk penerapan model. Parameter ini dibiarkan kosong.