全部产品
Search
文档中心

Platform For AI:Modularitas

更新时间:Jun 22, 2025

Modularitas adalah metrik yang mengukur kekuatan pembagian jaringan menjadi komunitas. Metrik ini menghitung kepadatan tautan di dalam komunitas dibandingkan dengan tautan antar komunitas. Nilai Modularitas lebih dari 0,3 menunjukkan bahwa jaringan memiliki struktur komunitas yang kuat. Machine Learning Designer menyediakan komponen Modularitas, yang dapat menghitung nilai Modularitas dari sebuah graf.

Konfigurasikan komponen

Metode 1: Gunakan konsol Platform for AI (PAI)

Untuk mengonfigurasi komponen di konsol PAI, masuk ke konsol PAI, buka halaman Pemodelan Visual (Designer), lalu buka pipeline. Di halaman pipeline, seret komponen Modularity ke kanvas dan konfigurasikan parameter di panel sebelah kanan. Tabel berikut menjelaskan parameter tersebut.

Kategori

Parameter

Deskripsi

Fields Setting

Source Vertex Column

Kolom yang berisi vertex awal dalam daftar tepi.

Initial Vertex Label Column

Grup tempat vertex awal dalam daftar tepi termasuk.

Target Vertex Column

Kolom yang berisi vertex akhir dalam daftar tepi.

Target Vertex Label Column

Grup tempat vertex akhir dalam daftar tepi termasuk.

Tuning

Number of Workers

Jumlah worker yang dijalankan secara bersamaan. Nilai yang lebih tinggi menghasilkan overhead komunikasi yang lebih besar.

Worker Memory (MB)

Jumlah maksimum memori yang dapat digunakan oleh worker. Unit: MB. Nilai default: 4096.

Jika penggunaan memori aktual melebihi nilai ini, pengecualian OutOfMemory akan dilemparkan.

Metode 2: Gunakan perintah PAI

Untuk mengonfigurasi komponen Modularity menggunakan perintah PAI, jalankan perintah dalam komponen SQL Script. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan Perintah PAI dalam Komponen Skrip SQL.

PAI -name Modularity
    -project algo_public
    -DinputEdgeTableName=Modularity_func_test_edge
    -DfromVertexCol=flow_out_id
    -DfromGroupCol=group_out_id
    -DtoVertexCol=flow_in_id
    -DtoGroupCol=group_in_id
    -DoutputTableName=Modularity_func_test_result;

Parameter

Diperlukan

Nilai default

Deskripsi

inputEdgeTableName

Ya

Tidak tersedia

Nama tabel input daftar tepi.

inputEdgeTablePartitions

Tidak

Daftar lengkap

Partisi dalam daftar tepi input.

fromVertexCol

Ya

Tidak tersedia

Kolom yang berisi vertex awal dalam daftar tepi.

fromGroupCol

Ya

Tidak tersedia

Grup tempat vertex awal dalam daftar tepi termasuk.

toVertexCol

Ya

Tidak tersedia

Kolom yang berisi vertex akhir dalam daftar tepi.

toGroupCol

Ya

Tidak tersedia

Grup tempat vertex akhir dalam daftar tepi termasuk.

outputTableName

Ya

Tidak tersedia

Nama tabel output.

outputTablePartitions

Tidak

Tidak tersedia

Partisi dalam tabel output.

lifecycle

Tidak

Tidak tersedia

Siklus hidup tabel output.

workerNum

Tidak

Tidak ada

Jumlah worker yang dijalankan secara bersamaan. Nilai yang lebih tinggi menghasilkan overhead komunikasi yang lebih besar.

workerMem

Tidak

4096

Jumlah maksimum memori yang dapat digunakan oleh worker. Unit: MB. Nilai default: 4096.

Jika penggunaan memori aktual melebihi nilai ini, pengecualian OutOfMemory akan dilemparkan.

splitSize

Tidak

64

Ukuran data input terpisah. Unit: MB.

Contoh

null

Hapus centang pada kotak Use Script Mode dan Whether the system adds a create table statement di panel sebelah kanan saat Anda melakukan langkah-langkah berikut.

  1. Tambahkan komponen SQL Script dan tempelkan pernyataan SQL berikut ke editor di panel sebelah kanan untuk menghasilkan data pelatihan:

    drop table if exists Modularity_func_test_edge;
    create table Modularity_func_test_edge as
    select * from
    (
        select '1' as flow_out_id,'3' as group_out_id,'2' as flow_in_id,'3' as group_in_id
        union all
        select '1' as flow_out_id,'3' as group_out_id,'3' as flow_in_id,'3' as group_in_id
        union all
        select '1' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id
        union all
        select '2' as flow_out_id,'3' as group_out_id,'3' as flow_in_id,'3' as group_in_id
        union all
        select '2' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id
        union all
        select '3' as flow_out_id,'3' as group_out_id,'4' as flow_in_id,'3' as group_in_id
        union all
        select '4' as flow_out_id,'3' as group_out_id,'6' as flow_in_id,'7' as group_in_id
        union all
        select '5' as flow_out_id,'7' as group_out_id,'6' as flow_in_id,'7' as group_in_id
        union all
        select '5' as flow_out_id,'7' as group_out_id,'7' as flow_in_id,'7' as group_in_id
        union all
        select '5' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id
        union all
        select '6' as flow_out_id,'7' as group_out_id,'7' as flow_in_id,'7' as group_in_id
        union all
        select '6' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id
        union all
        select '7' as flow_out_id,'7' as group_out_id,'8' as flow_in_id,'7' as group_in_id
    )tmp
    ;

    Struktur data graf yang sesuai:

    image

  2. Tambahkan komponen SQL Script lain dan tempelkan perintah berikut ke editor di panel sebelah kanan untuk memulai pelatihan. Lalu, hubungkan kedua komponen yang telah ditambahkan.

    drop table if exists ${o1};
    PAI -name Modularity
        -project algo_public
        -DinputEdgeTableName=Modularity_func_test_edge
        -DfromVertexCol=flow_out_id
        -DfromGroupCol=group_out_id
        -DtoVertexCol=flow_in_id
        -DtoGroupCol=group_in_id
        -DoutputTableName=${o1};
  3. Jalankan pipeline. Setelah eksekusi pipeline selesai, klik kanan komponen SQL Script yang Anda tambahkan di langkah sebelumnya dan pilih View Data > SQL Script Output di menu pintasan untuk melihat hasil pelatihan.

    | val                 |
    | ------------------- |
    | 0,42307692766189575 |