Gunakan komponen Modularity untuk hitung kekuatan komunitas graf - Platform For AI

Modularitas adalah metrik yang mengukur kekuatan pembagian jaringan menjadi komunitas. Metrik ini menghitung kepadatan tautan di dalam komunitas dibandingkan dengan tautan antar komunitas. Nilai Modularitas lebih dari 0,3 menunjukkan bahwa jaringan memiliki struktur komunitas yang kuat. Machine Learning Designer menyediakan komponen Modularitas, yang dapat menghitung nilai Modularitas dari sebuah graf.

Konfigurasikan komponen

Metode 1: Gunakan konsol Platform for AI (PAI)

Untuk mengonfigurasi komponen di konsol PAI, masuk ke konsol PAI, buka halaman Pemodelan Visual (Designer), lalu buka pipeline. Di halaman pipeline, seret komponen Modularity ke kanvas dan konfigurasikan parameter di panel sebelah kanan. Tabel berikut menjelaskan parameter tersebut.

Kategori	Parameter	Deskripsi
Fields Setting	Source Vertex Column	Kolom yang berisi vertex awal dalam daftar tepi.
	Initial Vertex Label Column	Grup tempat vertex awal dalam daftar tepi termasuk.
	Target Vertex Column	Kolom yang berisi vertex akhir dalam daftar tepi.
	Target Vertex Label Column	Grup tempat vertex akhir dalam daftar tepi termasuk.
Tuning	Number of Workers	Jumlah worker yang dijalankan secara bersamaan. Nilai yang lebih tinggi menghasilkan overhead komunikasi yang lebih besar.
Tuning	Worker Memory (MB)	Jumlah maksimum memori yang dapat digunakan oleh worker. Unit: MB. Nilai default: 4096. Jika penggunaan memori aktual melebihi nilai ini, pengecualian `OutOfMemory` akan dilemparkan.

Metode 2: Gunakan perintah PAI

Untuk mengonfigurasi komponen Modularity menggunakan perintah PAI, jalankan perintah dalam komponen SQL Script. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan Perintah PAI dalam Komponen Skrip SQL.

PAI -name Modularity
    -project algo_public
    -DinputEdgeTableName=Modularity_func_test_edge
    -DfromVertexCol=flow_out_id
    -DfromGroupCol=group_out_id
    -DtoVertexCol=flow_in_id
    -DtoGroupCol=group_in_id
    -DoutputTableName=Modularity_func_test_result;

Parameter	Diperlukan	Nilai default	Deskripsi
inputEdgeTableName	Ya	Tidak tersedia	Nama tabel input daftar tepi.
inputEdgeTablePartitions	Tidak	Daftar lengkap	Partisi dalam daftar tepi input.
fromVertexCol	Ya	Tidak tersedia	Kolom yang berisi vertex awal dalam daftar tepi.
fromGroupCol	Ya	Tidak tersedia	Grup tempat vertex awal dalam daftar tepi termasuk.
toVertexCol	Ya	Tidak tersedia	Kolom yang berisi vertex akhir dalam daftar tepi.
toGroupCol	Ya	Tidak tersedia	Grup tempat vertex akhir dalam daftar tepi termasuk.
outputTableName	Ya	Tidak tersedia	Nama tabel output.
outputTablePartitions	Tidak	Tidak tersedia	Partisi dalam tabel output.
lifecycle	Tidak	Tidak tersedia	Siklus hidup tabel output.
workerNum	Tidak	Tidak ada	Jumlah worker yang dijalankan secara bersamaan. Nilai yang lebih tinggi menghasilkan overhead komunikasi yang lebih besar.
workerMem	Tidak	4096	Jumlah maksimum memori yang dapat digunakan oleh worker. Unit: MB. Nilai default: 4096. Jika penggunaan memori aktual melebihi nilai ini, pengecualian `OutOfMemory` akan dilemparkan.
splitSize	Tidak	64	Ukuran data input terpisah. Unit: MB.

Contoh

null

Hapus centang pada kotak Use Script Mode dan Whether the system adds a create table statement di panel sebelah kanan saat Anda melakukan langkah-langkah berikut.

Tambahkan komponen SQL Script dan tempelkan pernyataan SQL berikut ke editor di panel sebelah kanan untuk menghasilkan data pelatihan:

drop table if exists Modularity_func_test_edge;
create table Modularity_func_test_edge as
select * from
(
    select '1' as flow_out_id,'3' as group_out_id,'2' as flow_in_id,'3' as group_in_id
    union all
    select '1' as flow_out_id,'3' as group_out_id,'3' as flow_in_id,'3' as group_in_id
    union all
    select '1' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id
    union all
    select '2' as flow_out_id,'3' as group_out_id,'3' as flow_in_id,'3' as group_in_id
    union all
    select '2' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id
    union all
    select '3' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id
    union all
    select '4' as flow_out_id,'3' as group_out_id,'6' as flow_in_id,'7' as group_in_id
    union all
    select '5' as flow_out_id,'7' as group_out_id,'6' as flow_in_id,'7' as group_in_id
    union all
    select '5' as flow_out_id,'7' as group_out_id,'7' as flow_in_id,'7' as group_in_id
    union all
    select '5' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id
    union all
    select '6' as flow_out_id,'7' as group_out_id,'7' as flow_in_id,'7' as group_in_id
    union all
    select '6' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id
    union all
    select '7' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id
)tmp
;

Struktur data graf yang sesuai:

Tambahkan komponen SQL Script lain dan tempelkan perintah berikut ke editor di panel sebelah kanan untuk memulai pelatihan. Lalu, hubungkan kedua komponen yang telah ditambahkan.

drop table if exists ${o1};
PAI -name Modularity
    -project algo_public
    -DinputEdgeTableName=Modularity_func_test_edge
    -DfromVertexCol=flow_out_id
    -DfromGroupCol=group_out_id
    -DtoVertexCol=flow_in_id
    -DtoGroupCol=group_in_id
    -DoutputTableName=${o1};

Jalankan pipeline. Setelah eksekusi pipeline selesai, klik kanan komponen SQL Script yang Anda tambahkan di langkah sebelumnya dan pilih View Data > SQL Script Output di menu pintasan untuk melihat hasil pelatihan.
```
| val                 |
| ------------------- |
| 0,42307692766189575 |
```