Algoritma K-Core digunakan untuk menemukan subgraf dengan nilai coreness tertentu dalam sebuah graf. K-Core dari suatu graf merujuk pada subgraf yang tersisa setelah simpul-simpul dengan derajat kurang dari atau sama dengan k dihapus secara iteratif. Komponen K-Core menghasilkan simpul-simpul yang terhubung ke semua simpul lain dalam subgraf tersebut.
Konfigurasikan komponen
Metode 1: Konfigurasikan komponen pada halaman pipeline
Anda dapat menambahkan komponen K-Core pada halaman pipeline Machine Learning Designer di konsol Platform for AI (PAI). Tabel berikut menjelaskan parameter-parameter yang digunakan.
Tab | Parameter | Deskripsi |
Fields Setting | Source Vertex Column | Kolom simpul awal dalam tabel tepi. |
Target Vertex Column | Kolom simpul akhir dalam tabel tepi. | |
Parameters Setting | k | Coreness dari sebuah simpul. Nilai default: 1. Jika sebuah simpul termasuk dalam k-core tetapi tidak termasuk dalam (k+1)-core, maka coreness dari simpul tersebut adalah k. |
Tuning | Workers | Jumlah simpul untuk eksekusi pekerjaan paralel. Tingkat paralelisme dan biaya komunikasi kerangka meningkat seiring dengan nilai parameter ini. |
Memory Size per Worker | Ukuran maksimum memori yang dapat digunakan oleh satu pekerjaan. Unit: MB. Nilai default: 4096. Jika ukuran memori yang digunakan melebihi nilai parameter ini, kesalahan |
Metode 2: Konfigurasikan komponen menggunakan perintah PAI
Anda dapat mengonfigurasi komponen K-Core menggunakan perintah PAI. Gunakan komponen SQL Script untuk menjalankan perintah PAI. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan perintah PAI dalam komponen SQL Script dalam topik "SQL Script".
PAI -name KCore
-project algo_public
-DinputEdgeTableName=KCore_func_test_edge
-DfromVertexCol=flow_out_id
-DtoVertexCol=flow_in_id
-DoutputTableName=KCore_func_test_result
-Dk=2;Parameter | Diperlukan | Nilai default | Deskripsi |
inputEdgeTableName | Ya | Tidak ada nilai default | Nama tabel tepi input. |
inputEdgeTablePartitions | Tidak | Tabel penuh | Partisi dalam tabel tepi input. |
fromVertexCol | Ya | Tidak ada nilai default | Kolom simpul awal dalam tabel tepi input. |
toVertexCol | Ya | Tidak ada nilai default | Kolom simpul akhir dalam tabel tepi input. |
outputTableName | Ya | Tidak ada nilai default | Nama tabel output. |
outputTablePartitions | Tidak | Tidak ada nilai default | Partisi dalam tabel output. |
lifecycle | Tidak | Tidak ada nilai default | Siklus hidup tabel output. |
workerNum | Tidak | Tidak ditentukan | Jumlah simpul untuk eksekusi pekerjaan paralel. Tingkat paralelisme dan biaya komunikasi kerangka meningkat seiring dengan nilai parameter ini. |
workerMem | Tidak | 4096 | Ukuran maksimum memori yang dapat digunakan oleh satu pekerjaan. Unit: MB. Nilai default: 4096. Jika ukuran memori yang digunakan melebihi nilai parameter ini, kesalahan |
splitSize | Tidak | 64 | Ukuran pemisahan data. |
k | Ya | 1 | Coreness dari sebuah simpul. |
Contoh
Tambahkan komponen SQL Script sebagai simpul ke kanvas dan jalankan pernyataan SQL berikut untuk menghasilkan data pelatihan.
drop table if exists KCore_func_test_edge; create table KCore_func_test_edge as select * from ( select '1' as flow_out_id,'2' as flow_in_id union all select '1' as flow_out_id,'3' as flow_in_id union all select '1' as flow_out_id,'4' as flow_in_id union all select '2' as flow_out_id,'3' as flow_in_id union all select '2' as flow_out_id,'4' as flow_in_id union all select '3' as flow_out_id,'4' as flow_in_id union all select '3' as flow_out_id,'5' as flow_in_id union all select '3' as flow_out_id,'6' as flow_in_id union all select '5' as flow_out_id,'6' as flow_in_id )tmp;Struktur data

Tambahkan komponen SQL Script sebagai simpul ke kanvas dan jalankan perintah PAI berikut untuk melatih model.
drop table if exists ${o1}; PAI -name KCore -project algo_public -DinputEdgeTableName=KCore_func_test_edge -DfromVertexCol=flow_out_id -DtoVertexCol=flow_in_id -DoutputTableName=${o1} -Dk=2;Klik kanan komponen SQL Script dan pilih View Data > SQL Script Output untuk melihat hasil pelatihan.
| node1 | node2 | | ----- | ----- | | 1 | 2 | | 1 | 3 | | 1 | 4 | | 2 | 1 | | 2 | 3 | | 2 | 4 | | 3 | 1 | | 3 | 2 | | 3 | 4 | | 4 | 1 | | 4 | 2 | | 4 | 3 |