Tema ini menjelaskan cara menggunakan algoritma fitur pengguna yang disediakan oleh Machine Learning Platform for AI (PAI) untuk membuat model guna memantau churn pengguna.
Informasi latar belakang
Meningkatkan basis pengguna dan mempertahankan pengguna yang ada merupakan kunci pertumbuhan bisnis. Anda dapat menggunakan model pengendalian risiko untuk mengidentifikasi pengguna yang kemungkinan akan churn dan mengambil langkah-langkah pencegahan.
Solusi arus utama untuk memantau churn pengguna biasanya berbasis aturan dan kurang cerdas dalam menambang pengguna yang berpotensi churn secara akurat.
Solusi
- Anda menguasai pengetahuan pemodelan dasar.
- Anda dapat sepenuhnya terlibat dalam pengembangan selama satu hingga dua hari.
- Anda memiliki lebih dari 1.000 catatan data berlabel yang mencerminkan karakteristik situasi di mana pengguna churn.
Dataset
Tabel berikut menjelaskan bidang dalam dataset.| Bidang | Deskripsi |
| customerid | ID pengguna. |
| gender | Jenis kelamin pengguna. |
| SeniorCitizen | Menentukan apakah pengguna adalah warga negara. Nilai valid:
|
| Partner | Menentukan apakah pengguna memiliki pasangan. |
| Dependents | Menentukan apakah pengguna berafiliasi. |
| tenure | Durasi layanan yang diberikan kepada pengguna oleh penyedia layanan. |
| PhoneService | Menentukan apakah pengguna berlangganan layanan telepon seluler. |
| MultipleLine | Menentukan apakah pengguna menggunakan beberapa jalur layanan. |
| InternetService | Layanan Internet yang digunakan pengguna, seperti DSL atau Fiber optic. |
| OnlineSecurity | Menentukan apakah pengguna menghadapi masalah keamanan Internet. |
| OnlineBackup | Menentukan apakah pengguna memiliki akses ke dukungan online. |
| DeviceProtection | Menentukan apakah pengguna memiliki akses ke perlindungan layanan. |
| TechSupport | Menentukan apakah pengguna telah mengajukan dukungan teknis. |
| StreamingTV | Menentukan apakah pengguna memiliki akses ke program TV streaming. |
| StreamingMovies | Menentukan apakah pengguna memiliki akses ke film streaming. |
| Contract | Periode kontrak, seperti Month-to-month atau Two year. |
| PaperlessBilling | Menentukan apakah pengguna menerima tagihan elektronik. |
| PaymentMethod | Metode pembayaran yang digunakan oleh pengguna. |
| MonthlyCharges | Pengeluaran bulanan pengguna. |
| TotalCharges | Total pengeluaran pengguna. |
| Bidang | Deskripsi |
| churn | Menentukan apakah pengguna churn. |
Prosedur
Buka halaman Machine Learning Designer.
Masuk ke Konsol PAI.
Di panel navigasi di sisi kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.
Di panel navigasi di sisi kiri, pilih .
- Buat pipeline.
Di halaman Visualized Modeling (Designer), klik tab Preset Templates.
- Di tab ini, temukan template Churn User Monitoring dan klik Create.
Di kotak dialog Create Pipeline, konfigurasikan parameter. Anda dapat menggunakan nilai default mereka.
Nilai yang ditentukan untuk parameter Pipeline Data Path adalah jalur bucket Object Storage Service (OSS) untuk data sementara dan model yang dihasilkan selama runtime pipeline.
Klik OK.
Dibutuhkan sekitar 10 detik untuk membuat pipeline.
- Di tab Pipelines, klik dua kali pipeline Churn User Monitoring yang dibuat untuk membukanya.
- Lihat komponen pipeline di kanvas, seperti yang ditunjukkan pada gambar berikut. Sistem secara otomatis membuat pipeline berdasarkan template bawaan.

Bagian Deskripsi ① Komponen yang ditampilkan di bagian ini mengimpor dataset yang digunakan oleh pipeline. ② Komponen One Hot Encoding-1 dan SQL Script-1 yang ditampilkan di bagian ini melakukan rekayasa fitur untuk mengonversi data fitur bertipe STRING menjadi data fitur bertipe numerik. Sebagai contoh, nilai asli dari bidang churn adalah Yes atau No. Komponen SQL Script-1 mengeksekusi pernyataan SQL untuk mengonversi Yes menjadi 1 dan No menjadi 0. select (case churn when 'Yes' then 1 else 0 end) as churn from ${t1};③ Komponen yang ditampilkan di bagian ini membagi dataset menjadi dataset pelatihan dan dataset prediksi. Pengguna mungkin churn atau tidak. Oleh karena itu, Anda dapat menggunakan algoritma klasifikasi biner untuk memprediksi churn pengguna. ④ Komponen Binary Classification Evaluation-1 mengevaluasi kualitas model dengan menggunakan indeks seperti luas di bawah kurva (AUC), nilai Kolmogorov-Smirnov (KS), atau skor F1.
- Jalankan pipeline dan lihat hasilnya.
- Di sudut kiri atas kanvas, klik ikon Run.
- Setelah pipeline dijalankan, klik kanan komponen Binary Classification Evaluation-1. Di menu pintasan yang muncul, klik Visual Analysis.
- Di bagian Evaluate, klik tab Index data untuk melihat indeks yang digunakan untuk mengevaluasi model.
Semakin dekat nilai AUC dengan 1, semakin tinggi akurasi prediksi model. Pada gambar di atas, nilai AUC lebih besar dari 0,8. Ini menunjukkan bahwa akurasi prediksi model tinggi.