全部产品
Search
文档中心

Platform For AI:Gunakan algoritma graf untuk mengelola risiko keuangan

更新时间:Jun 22, 2025

Topik ini menjelaskan cara menggunakan algoritma graf untuk mengelola risiko keuangan.

Informasi latar belakang

Algoritma graf digunakan dalam skenario analisis hubungan. Algoritma ini menyusun data menjadi graf hubungan yang berisi koneksi antara simpul, dengan koneksi direpresentasikan sebagai tepi. Machine Learning Platform for AI (PAI) menyediakan beberapa komponen algoritma graf, termasuk K-Core, Subgraf Terhubung Maksimum, dan Klasifikasi Propagasi Label.

Gambar berikut menunjukkan contoh graf hubungan dari sekelompok orang yang saling terhubung. Panah pada gambar mewakili hubungan antara individu, seperti rekan kerja atau kerabat. Dalam graf ini, Enoch adalah pelanggan tepercaya, sedangkan Evan adalah penipu. Berdasarkan informasi ini dan graf hubungan, Anda dapat menggunakan algoritma graf untuk menghitung indeks kredit setiap individu, yaitu probabilitas seseorang menjadi penipu. Relationship graphs

Dataset

Tabel berikut menjelaskan bidang-bidang dalam dataset yang digunakan dalam topik ini.

Bidang

Arti

Tipe

Deskripsi

start_point

Simpul awal dari sebuah tepi

STRING

Nama seseorang.

end_point

Simpul akhir dari sebuah tepi

STRING

Nama seseorang.

count

Kedekatan

DOUBLE

Kedekatan antara dua orang. Nilai yang lebih besar menunjukkan hubungan yang lebih dekat antara kedua orang tersebut.

Gambar berikut menunjukkan data sampel yang digunakan dalam pipeline. Sample data

Prosedur

  1. Buka halaman Machine Learning Designer.

    1. Masuk ke Konsol PAI.

    2. Di panel navigasi sebelah kiri, klik Workspaces. Pada halaman Workspaces, klik nama workspace yang ingin dikelola.

    3. Di panel navigasi sebelah kiri, pilih Model Training > Visualized Modeling (Designer).

  2. Buat pipeline.

    1. Di halaman Pemodelan Visual (Designer), klik tab Preset Templates.

    2. Di tab tersebut, temukan template Financial Risk Management dan klik Create.

    3. Di kotak dialog Create Pipeline, konfigurasikan parameter berikut. Anda dapat menggunakan nilai default mereka.

      Nilai yang ditentukan untuk parameter Pipeline Data Path adalah jalur bucket Object Storage Service (OSS) untuk data sementara dan model yang dihasilkan selama waktu proses pipeline.

    4. Klik OK.

      Pipeline akan dibuat dalam waktu sekitar 10 detik.

    5. Di tab Pipelines, klik dua kali pipeline Financial Risk Management untuk membuka pipeline.

    6. Lihat komponen pipeline di kanvas, seperti yang ditunjukkan pada gambar berikut. Sistem secara otomatis membuat pipeline berdasarkan template bawaan.

      Graph algorithm pipeline

      Bagian

      Deskripsi

      Komponen Maximum Connected Subgraph mengklasifikasikan orang-orang dalam graf hubungan menjadi dua kelompok, dan memberikan ID kepada setiap kelompok. Kemudian, komponen SQL Script dan JOIN menghapus orang-orang yang tidak terkait dalam graf hubungan.

      Komponen Maximum Connected Subgraph dapat menemukan himpunan yang berisi jumlah orang terbesar yang saling terhubung untuk menghapus orang-orang yang tidak terkait, seperti yang ditunjukkan pada gambar berikut. max connected set

      Komponen yang ditampilkan di bagian ini mengeksplorasi jarak antara dua simpul. Di output komponen Single-source Shortest Path, bidang distance menunjukkan jumlah orang yang harus dihubungi oleh Enoch untuk mencapai orang yang diinginkan, seperti yang ditunjukkan pada gambar berikut. Single-source shortest path results

      Komponen Data Source mengimpor data yang telah diberi label. Bidang weight menunjukkan probabilitas seseorang menjadi penipu. Kemudian, komponen Label Propagation Classification memprediksi label dari simpul yang tidak berlabel. Akhirnya, komponen SQL Script menyaring hasil dan menampilkan probabilitas setiap orang menjadi penipu. Example of labeled data

      Klasifikasi propagasi label adalah algoritma klasifikasi semi-terawasi. Ini menggunakan graf hubungan dan data berlabel sebagai inputnya dan memprediksi label dari simpul yang tidak berlabel berdasarkan label dari simpul yang berlabel. Klasifikasi propagasi label menyebarkan label setiap simpul ke simpul-simpul di sebelah simpul tersebut.

  3. Jalankan pipeline dan lihat hasilnya.

    1. Di sudut kiri atas kanvas, klik image.

    2. Setelah pipeline dijalankan, klik kanan SQL Script di kanvas dan pilih View Data. Di tab yang muncul, lihat probabilitas setiap individu menjadi penipu.