全部产品
Search
文档中心

Platform For AI:K-Core

更新时间:Jul 02, 2025

Algoritma K-Core digunakan untuk menemukan subgraf dengan nilai coreness tertentu dalam sebuah graf. K-Core dari suatu graf merujuk pada subgraf yang tersisa setelah simpul-simpul dengan derajat kurang dari atau sama dengan k dihapus secara iteratif. Komponen K-Core menghasilkan simpul-simpul yang terhubung ke semua simpul lain dalam subgraf tersebut.

Konfigurasikan komponen

Metode 1: Konfigurasikan komponen pada halaman pipeline

Anda dapat menambahkan komponen K-Core pada halaman pipeline Machine Learning Designer di konsol Platform for AI (PAI). Tabel berikut menjelaskan parameter-parameter yang digunakan.

Tab

Parameter

Deskripsi

Fields Setting

Source Vertex Column

Kolom simpul awal dalam tabel tepi.

Target Vertex Column

Kolom simpul akhir dalam tabel tepi.

Parameters Setting

k

Coreness dari sebuah simpul. Nilai default: 1.

Jika sebuah simpul termasuk dalam k-core tetapi tidak termasuk dalam (k+1)-core, maka coreness dari simpul tersebut adalah k.

Tuning

Workers

Jumlah simpul untuk eksekusi pekerjaan paralel. Tingkat paralelisme dan biaya komunikasi kerangka meningkat seiring dengan nilai parameter ini.

Memory Size per Worker

Ukuran maksimum memori yang dapat digunakan oleh satu pekerjaan. Unit: MB. Nilai default: 4096.

Jika ukuran memori yang digunakan melebihi nilai parameter ini, kesalahan OutOfMemory akan dilaporkan.

Metode 2: Konfigurasikan komponen menggunakan perintah PAI

Anda dapat mengonfigurasi komponen K-Core menggunakan perintah PAI. Gunakan komponen SQL Script untuk menjalankan perintah PAI. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan perintah PAI dalam komponen SQL Script dalam topik "SQL Script".

PAI -name KCore
    -project algo_public
    -DinputEdgeTableName=KCore_func_test_edge
    -DfromVertexCol=flow_out_id
    -DtoVertexCol=flow_in_id
    -DoutputTableName=KCore_func_test_result
    -Dk=2;

Parameter

Diperlukan

Nilai default

Deskripsi

inputEdgeTableName

Ya

Tidak ada nilai default

Nama tabel tepi input.

inputEdgeTablePartitions

Tidak

Tabel penuh

Partisi dalam tabel tepi input.

fromVertexCol

Ya

Tidak ada nilai default

Kolom simpul awal dalam tabel tepi input.

toVertexCol

Ya

Tidak ada nilai default

Kolom simpul akhir dalam tabel tepi input.

outputTableName

Ya

Tidak ada nilai default

Nama tabel output.

outputTablePartitions

Tidak

Tidak ada nilai default

Partisi dalam tabel output.

lifecycle

Tidak

Tidak ada nilai default

Siklus hidup tabel output.

workerNum

Tidak

Tidak ditentukan

Jumlah simpul untuk eksekusi pekerjaan paralel. Tingkat paralelisme dan biaya komunikasi kerangka meningkat seiring dengan nilai parameter ini.

workerMem

Tidak

4096

Ukuran maksimum memori yang dapat digunakan oleh satu pekerjaan. Unit: MB. Nilai default: 4096.

Jika ukuran memori yang digunakan melebihi nilai parameter ini, kesalahan OutOfMemory akan dilaporkan.

splitSize

Tidak

64

Ukuran pemisahan data.

k

Ya

1

Coreness dari sebuah simpul.

Contoh

  1. Tambahkan komponen SQL Script sebagai simpul ke kanvas dan jalankan pernyataan SQL berikut untuk menghasilkan data pelatihan.

    drop table if exists KCore_func_test_edge;
    create table KCore_func_test_edge as
    select * from
    (
      select '1' as flow_out_id,'2' as flow_in_id
      union all
      select '1' as flow_out_id,'3' as flow_in_id
      union all
      select '1' as flow_out_id,'4' as flow_in_id
      union all
      select '2' as flow_out_id,'3' as flow_in_id
      union all
      select '2' as flow_out_id,'4' as flow_in_id
      union all
      select '3' as flow_out_id,'4' as flow_in_id
      union all
      select '3' as flow_out_id,'5' as flow_in_id
      union all
      select '3' as flow_out_id,'6' as flow_in_id
      union all
      select '5' as flow_out_id,'6' as flow_in_id
    )tmp;

    Struktur data

    image

  2. Tambahkan komponen SQL Script sebagai simpul ke kanvas dan jalankan perintah PAI berikut untuk melatih model.

    drop table if exists ${o1};
    PAI -name KCore
        -project algo_public
        -DinputEdgeTableName=KCore_func_test_edge
        -DfromVertexCol=flow_out_id
        -DtoVertexCol=flow_in_id
        -DoutputTableName=${o1}
        -Dk=2;
  3. Klik kanan komponen SQL Script dan pilih View Data > SQL Script Output untuk melihat hasil pelatihan.

    | node1 | node2 |
    | ----- | ----- |
    | 1     | 2     |
    | 1     | 3     |
    | 1     | 4     |
    | 2     | 1     |
    | 2     | 3     |
    | 2     | 4     |
    | 3     | 1     |
    | 3     | 2     |
    | 3     | 4     |
    | 4     | 1     |
    | 4     | 2     |
    | 4     | 3     |