全部产品
Search
文档中心

Platform For AI:Memantau Churn Pengguna

更新时间:Jun 22, 2025

Tema ini menjelaskan cara menggunakan algoritma fitur pengguna yang disediakan oleh Machine Learning Platform for AI (PAI) untuk membuat model guna memantau churn pengguna.

Informasi latar belakang

Meningkatkan basis pengguna dan mempertahankan pengguna yang ada merupakan kunci pertumbuhan bisnis. Anda dapat menggunakan model pengendalian risiko untuk mengidentifikasi pengguna yang kemungkinan akan churn dan mengambil langkah-langkah pencegahan.

Solusi arus utama untuk memantau churn pengguna biasanya berbasis aturan dan kurang cerdas dalam menambang pengguna yang berpotensi churn secara akurat.

Solusi

PAI menyediakan solusi komprehensif untuk melakukan pengkodean fitur, pelatihan model klasifikasi, dan evaluasi model berdasarkan data berlabel. Sebelum menggunakan solusi ini, pastikan kondisi berikut terpenuhi:
  • Anda menguasai pengetahuan pemodelan dasar.
  • Anda dapat sepenuhnya terlibat dalam pengembangan selama satu hingga dua hari.
  • Anda memiliki lebih dari 1.000 catatan data berlabel yang mencerminkan karakteristik situasi di mana pengguna churn.

Dataset

Pipeline yang dijelaskan dalam tema ini menggunakan data nyata yang telah dimasking, yang dikumpulkan dari platform telekomunikasi. Dataset tersebut mencakup 7.043 catatan data, termasuk informasi dasar dan status churn setiap pengguna. Gambar berikut menunjukkan data sampel yang digunakan dalam pipeline.Dataset for the pipeline on monitoring user churnTabel berikut menjelaskan bidang dalam dataset.
BidangDeskripsi
customeridID pengguna.
genderJenis kelamin pengguna.
SeniorCitizenMenentukan apakah pengguna adalah warga negara. Nilai valid:
  • 1: Pengguna adalah warga negara.
  • 0: Pengguna bukan warga negara.
PartnerMenentukan apakah pengguna memiliki pasangan.
DependentsMenentukan apakah pengguna berafiliasi.
tenureDurasi layanan yang diberikan kepada pengguna oleh penyedia layanan.
PhoneServiceMenentukan apakah pengguna berlangganan layanan telepon seluler.
MultipleLineMenentukan apakah pengguna menggunakan beberapa jalur layanan.
InternetServiceLayanan Internet yang digunakan pengguna, seperti DSL atau Fiber optic.
OnlineSecurityMenentukan apakah pengguna menghadapi masalah keamanan Internet.
OnlineBackupMenentukan apakah pengguna memiliki akses ke dukungan online.
DeviceProtectionMenentukan apakah pengguna memiliki akses ke perlindungan layanan.
TechSupportMenentukan apakah pengguna telah mengajukan dukungan teknis.
StreamingTVMenentukan apakah pengguna memiliki akses ke program TV streaming.
StreamingMoviesMenentukan apakah pengguna memiliki akses ke film streaming.
ContractPeriode kontrak, seperti Month-to-month atau Two year.
PaperlessBillingMenentukan apakah pengguna menerima tagihan elektronik.
PaymentMethodMetode pembayaran yang digunakan oleh pengguna.
MonthlyChargesPengeluaran bulanan pengguna.
TotalChargesTotal pengeluaran pengguna.
Tabel berikut menjelaskan bidang dalam data berlabel.
BidangDeskripsi
churnMenentukan apakah pengguna churn.

Prosedur

  1. Buka halaman Machine Learning Designer.

    1. Masuk ke Konsol PAI.

    2. Di panel navigasi di sisi kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.

    3. Di panel navigasi di sisi kiri, pilih Model Training > Visualized Modeling (Designer).

  2. Buat pipeline.
    1. Di halaman Visualized Modeling (Designer), klik tab Preset Templates.

    2. Di tab ini, temukan template Churn User Monitoring dan klik Create.
    3. Di kotak dialog Create Pipeline, konfigurasikan parameter. Anda dapat menggunakan nilai default mereka.

      Nilai yang ditentukan untuk parameter Pipeline Data Path adalah jalur bucket Object Storage Service (OSS) untuk data sementara dan model yang dihasilkan selama runtime pipeline.

    4. Klik OK.

      Dibutuhkan sekitar 10 detik untuk membuat pipeline.

    5. Di tab Pipelines, klik dua kali pipeline Churn User Monitoring yang dibuat untuk membukanya.
    6. Lihat komponen pipeline di kanvas, seperti yang ditunjukkan pada gambar berikut. Sistem secara otomatis membuat pipeline berdasarkan template bawaan.
      Churn user monitoring
      BagianDeskripsi
      Komponen yang ditampilkan di bagian ini mengimpor dataset yang digunakan oleh pipeline.
      Komponen One Hot Encoding-1 dan SQL Script-1 yang ditampilkan di bagian ini melakukan rekayasa fitur untuk mengonversi data fitur bertipe STRING menjadi data fitur bertipe numerik. Sebagai contoh, nilai asli dari bidang churn adalah Yes atau No. Komponen SQL Script-1 mengeksekusi pernyataan SQL untuk mengonversi Yes menjadi 1 dan No menjadi 0.
      select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};
      Komponen yang ditampilkan di bagian ini membagi dataset menjadi dataset pelatihan dan dataset prediksi. Pengguna mungkin churn atau tidak. Oleh karena itu, Anda dapat menggunakan algoritma klasifikasi biner untuk memprediksi churn pengguna.
      Komponen Binary Classification Evaluation-1 mengevaluasi kualitas model dengan menggunakan indeks seperti luas di bawah kurva (AUC), nilai Kolmogorov-Smirnov (KS), atau skor F1.
  3. Jalankan pipeline dan lihat hasilnya.
    1. Di sudut kiri atas kanvas, klik ikon Run.
    2. Setelah pipeline dijalankan, klik kanan komponen Binary Classification Evaluation-1. Di menu pintasan yang muncul, klik Visual Analysis.
    3. Di bagian Evaluate, klik tab Index data untuk melihat indeks yang digunakan untuk mengevaluasi model.
      Model effectsSemakin dekat nilai AUC dengan 1, semakin tinggi akurasi prediksi model. Pada gambar di atas, nilai AUC lebih besar dari 0,8. Ini menunjukkan bahwa akurasi prediksi model tinggi.