Modularitas adalah metrik yang mengukur kekuatan pembagian jaringan menjadi komunitas. Metrik ini menghitung kepadatan tautan di dalam komunitas dibandingkan dengan tautan antar komunitas. Nilai Modularitas lebih dari 0,3 menunjukkan bahwa jaringan memiliki struktur komunitas yang kuat. Machine Learning Designer menyediakan komponen Modularitas, yang dapat menghitung nilai Modularitas dari sebuah graf.
Konfigurasikan komponen
Metode 1: Gunakan konsol Platform for AI (PAI)
Untuk mengonfigurasi komponen di konsol PAI, masuk ke konsol PAI, buka halaman Pemodelan Visual (Designer), lalu buka pipeline. Di halaman pipeline, seret komponen Modularity ke kanvas dan konfigurasikan parameter di panel sebelah kanan. Tabel berikut menjelaskan parameter tersebut.
Kategori | Parameter | Deskripsi |
Fields Setting | Source Vertex Column | Kolom yang berisi vertex awal dalam daftar tepi. |
Initial Vertex Label Column | Grup tempat vertex awal dalam daftar tepi termasuk. | |
Target Vertex Column | Kolom yang berisi vertex akhir dalam daftar tepi. | |
Target Vertex Label Column | Grup tempat vertex akhir dalam daftar tepi termasuk. | |
Tuning | Number of Workers | Jumlah worker yang dijalankan secara bersamaan. Nilai yang lebih tinggi menghasilkan overhead komunikasi yang lebih besar. |
Worker Memory (MB) | Jumlah maksimum memori yang dapat digunakan oleh worker. Unit: MB. Nilai default: 4096. Jika penggunaan memori aktual melebihi nilai ini, pengecualian |
Metode 2: Gunakan perintah PAI
Untuk mengonfigurasi komponen Modularity menggunakan perintah PAI, jalankan perintah dalam komponen SQL Script. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan Perintah PAI dalam Komponen Skrip SQL.
PAI -name Modularity
-project algo_public
-DinputEdgeTableName=Modularity_func_test_edge
-DfromVertexCol=flow_out_id
-DfromGroupCol=group_out_id
-DtoVertexCol=flow_in_id
-DtoGroupCol=group_in_id
-DoutputTableName=Modularity_func_test_result;Parameter | Diperlukan | Nilai default | Deskripsi |
inputEdgeTableName | Ya | Tidak tersedia | Nama tabel input daftar tepi. |
inputEdgeTablePartitions | Tidak | Daftar lengkap | Partisi dalam daftar tepi input. |
fromVertexCol | Ya | Tidak tersedia | Kolom yang berisi vertex awal dalam daftar tepi. |
fromGroupCol | Ya | Tidak tersedia | Grup tempat vertex awal dalam daftar tepi termasuk. |
toVertexCol | Ya | Tidak tersedia | Kolom yang berisi vertex akhir dalam daftar tepi. |
toGroupCol | Ya | Tidak tersedia | Grup tempat vertex akhir dalam daftar tepi termasuk. |
outputTableName | Ya | Tidak tersedia | Nama tabel output. |
outputTablePartitions | Tidak | Tidak tersedia | Partisi dalam tabel output. |
lifecycle | Tidak | Tidak tersedia | Siklus hidup tabel output. |
workerNum | Tidak | Tidak ada | Jumlah worker yang dijalankan secara bersamaan. Nilai yang lebih tinggi menghasilkan overhead komunikasi yang lebih besar. |
workerMem | Tidak | 4096 | Jumlah maksimum memori yang dapat digunakan oleh worker. Unit: MB. Nilai default: 4096. Jika penggunaan memori aktual melebihi nilai ini, pengecualian |
splitSize | Tidak | 64 | Ukuran data input terpisah. Unit: MB. |
Contoh
Hapus centang pada kotak Use Script Mode dan Whether the system adds a create table statement di panel sebelah kanan saat Anda melakukan langkah-langkah berikut.
Tambahkan komponen SQL Script dan tempelkan pernyataan SQL berikut ke editor di panel sebelah kanan untuk menghasilkan data pelatihan:
drop table if exists Modularity_func_test_edge; create table Modularity_func_test_edge as select * from ( select '1' as flow_out_id,'3' as group_out_id,'2' as flow_in_id,'3' as group_in_id union all select '1' as flow_out_id,'3' as group_out_id,'3' as flow_in_id,'3' as group_in_id union all select '1' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id union all select '2' as flow_out_id,'3' as group_out_id,'3' as flow_in_id,'3' as group_in_id union all select '2' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id union all select '3' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id union all select '4' as flow_out_id,'3' as group_out_id,'6' as flow_in_id,'7' as group_in_id union all select '5' as flow_out_id,'7' as group_out_id,'6' as flow_in_id,'7' as group_in_id union all select '5' as flow_out_id,'7' as group_out_id,'7' as flow_in_id,'7' as group_in_id union all select '5' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id union all select '6' as flow_out_id,'7' as group_out_id,'7' as flow_in_id,'7' as group_in_id union all select '6' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id union all select '7' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id )tmp ;Struktur data graf yang sesuai:

Tambahkan komponen SQL Script lain dan tempelkan perintah berikut ke editor di panel sebelah kanan untuk memulai pelatihan. Lalu, hubungkan kedua komponen yang telah ditambahkan.
drop table if exists ${o1}; PAI -name Modularity -project algo_public -DinputEdgeTableName=Modularity_func_test_edge -DfromVertexCol=flow_out_id -DfromGroupCol=group_out_id -DtoVertexCol=flow_in_id -DtoGroupCol=group_in_id -DoutputTableName=${o1};Jalankan pipeline. Setelah eksekusi pipeline selesai, klik kanan komponen SQL Script yang Anda tambahkan di langkah sebelumnya dan pilih View Data > SQL Script Output di menu pintasan untuk melihat hasil pelatihan.
| val | | ------------------- | | 0,42307692766189575 |