Terapkan kontrol risiko finansial dengan template algoritma graph di Designer - Platform For AI - Alibaba Cloud - Platform For AI

Pelaku penipuan jarang bertindak sendiri. Mereka beroperasi dalam jaringan—berbagi akun, alamat, perangkat, dan kontak. Sistem berbasis aturan tradisional mengevaluasi setiap individu secara terpisah dan mengabaikan koneksi tersembunyi ini. Algoritma graf mendeteksi penipuan dengan menganalisis hubungan antarindividu, bukan hanya atribut masing-masing.

Tutorial ini menjelaskan cara menggunakan templat pipeline Financial Risk Management di PAI Designer untuk menghitung skor probabilitas penipuan bagi setiap individu dalam jaringan hubungan.

Cara pipeline mendeteksi penipuan

Pipeline merepresentasikan individu sebagai vertex dan hubungan mereka sebagai edge. Setiap edge memiliki nilai count yang mengukur kedekatan—nilai yang lebih tinggi menunjukkan hubungan yang lebih kuat.

Tiga komponen algoritma graf dijalankan secara berurutan:

Maximum Connected Subgraph — mengklasifikasikan individu dalam graf hubungan menjadi dua kelompok dan memberikan ID pada masing-masing kelompok. Kemudian, bersama komponen SQL Script dan JOIN, menghapus individu yang tidak terkait dengan memilih himpunan yang berisi jumlah terbesar individu yang saling terhubung.
Single-Source Shortest Path — mengukur jumlah individu yang harus dihubungi Enoch untuk mencapai target. Bidang output distance mencatat jumlah hop tersebut.
Label Propagation Classification — menyebarkan label penipuan dari kasus yang diketahui (Evan, seorang penipu) melalui jaringan. Label menyebar dari vertex berlabel ke vertex yang berdekatan dengannya. Bidang output weight mencatat probabilitas bahwa setiap individu adalah penipu.

Dataset

Pipeline menggunakan dataset hubungan dengan bidang-bidang berikut.

Field	Type	Description
`start_point`	STRING	Vertex awal suatu edge. Nama seseorang.
`end_point`	STRING	Vertex akhir suatu edge. Nama seseorang.
`count`	DOUBLE	Kedekatan antara dua orang. Nilai yang lebih tinggi menunjukkan hubungan yang lebih dekat.

Gambar berikut menunjukkan data sampel yang digunakan dalam pipeline. 示例数据

Prasyarat

Sebelum memulai, pastikan Anda telah memiliki:

Ruang kerja PAI. Untuk instruksi penyiapan, lihat dokumentasi PAI.
Akses ke Konsol PAI dengan izin untuk menggunakan Designer.

Buat dan jalankan pipeline

Langkah 1: Buka Designer

Masuk ke PAI console.
Di panel navigasi sebelah kiri, klik Workspaces. Pada halaman Workspaces, klik nama ruang kerja Anda.
Di panel navigasi sebelah kiri, pilih Model Training > Visualized Modeling (Designer).

Langkah 2: Buat pipeline dari templat

Pada halaman Visualized Modeling (Designer), klik tab Preset Templates.
Temukan templat Financial Risk Management dan klik Create.
Pada kotak dialog Create Pipeline, tinjau parameter-parameter tersebut. Parameter Data Storage menetapkan path bucket Object Storage Service (OSS) tempat pipeline menyimpan data sementara dan model selama waktu proses. Nilai default sudah sesuai untuk tutorial ini.
Klik OK. Pembuatan pipeline memerlukan waktu sekitar 10 detik.
Pada tab Pipelines, klik ganda pipeline Financial Risk Management untuk membukanya di Kanvas.

Kanvas menampilkan pipeline dengan tiga bagian. Graph algorithm pipeline

Section	Components	Purpose
①	Maximum Connected Subgraph → SQL Script → JOIN	Mengklasifikasikan individu ke dalam dua kelompok dan memberikan ID pada masing-masing kelompok. Lalu menghapus individu yang tidak terkait dengan memilih himpunan yang memiliki jumlah terbesar individu yang saling terhubung.
②	Single-Source Shortest Path	Menghitung jumlah individu yang harus dihubungi Enoch untuk mencapai target. Bidang `distance` dalam output mencatat nilai ini.
③	Data Source → Label Propagation Classification → SQL Script	Mengimpor data berlabel (di mana `weight` = probabilitas penipuan), menyebarkan label penipuan dari pelaku penipuan yang diketahui melalui jaringan ke vertex yang berdekatan, dan memfilter hasilnya untuk menampilkan probabilitas penipuan setiap individu.

Langkah 3: Jalankan pipeline dan lihat hasilnya

Di pojok kiri atas Kanvas, klik untuk menjalankan pipeline.
Setelah eksekusi selesai, klik kanan SQL di Kanvas dan pilih View Data.

Tabel output menampilkan probabilitas setiap individu sebagai penipu.

Mengapa algoritma graf mendeteksi penipuan yang tidak terdeteksi oleh sistem berbasis aturan

Gambar berikut menunjukkan contoh graf hubungan. Panah merepresentasikan hubungan seperti rekan kerja atau saudara. Dalam graf ini, Enoch adalah pelanggan tepercaya dan Evan adalah penipu. 任务关系图

Machine Learning Platform for AI (PAI) menyediakan beberapa komponen algoritma graf untuk analisis hubungan, termasuk K-Core, Maximum Connected Subgraph, dan Label Propagation Classification. Komponen-komponen ini menganalisis struktur hubungan untuk mengungkap sinyal risiko yang tidak terdeteksi oleh model tingkat individu.

Cara kerja label propagation: Label Propagation Classification adalah algoritma klasifikasi semi-supervised. Algoritma ini menggunakan graf hubungan dan data berlabel sebagai input, lalu memprediksi label vertex yang tidak berlabel berdasarkan label vertex yang telah berlabel. Propagasi label menyebarkan label setiap vertex ke vertex yang berdekatan dengannya.