Customer Churn Analysis
Brief Overview of Customer Churn Analysis and Prediction with Decision Tree Classifier.
Customer Churn este una dintre cele mai importante și mai dificile probleme pentru întreprinderi, cum ar fi companiile de carduri de credit, furnizorii de servicii de cablu, SASS și companiile de telecomunicații din întreaga lume. Chiar dacă nu este cel mai distractiv de privit, măsurătorile de dezabonare a clienților pot ajuta întreprinderile să îmbunătățească retenția clienților.
Potem clasifica rata de dezabonare a clienților (cunoscută și sub numele de uzură a clienților) prin gruparea lor în diferite categorii. Churn contractual, care se aplică la întreprinderi precum companiile de cablu și furnizorii de servicii SAAS, este atunci când clienții decid să nu-și mai continue contractele expirate. Churn voluntar, pe de altă parte, este atunci când un client decide să își anuleze serviciul existent, care poate fi aplicabil pentru companii precum cele de telefoane mobile preplătite și furnizorii de abonamente de streaming. Există, de asemenea, momente în care consumatorii părăsesc o posibilă achiziție fără a finaliza tranzacția. Putem clasifica aceste cazuri drept dezabonare necontractuală, care este aplicabilă pentru întreprinderile care se bazează pe locații de vânzare cu amănuntul, magazine online sau servicii de împrumut online. Și, în cele din urmă, există dezabonarea involuntară, de exemplu, atunci când un client nu își poate plăti factura de card de credit și nu mai rămâne cu compania de carduri de credit.
Motivația dezabonării clienților poate varia și ar necesita cunoștințe de domeniu pentru a fi definită în mod corespunzător, însă unele dintre cele mai comune sunt; lipsa de utilizare a produsului, servicii slabe și un preț mai bun în altă parte. Indiferent de raționamentele care pot fi specifice pentru diferite industrii, un lucru se aplică pentru fiecare domeniu este că, este mai costisitor să achiziționezi noi clienți decât să-i păstrezi pe cei existenți. Acest lucru are un impact direct asupra costurilor de operare și a bugetelor de marketing din cadrul companiei.
Din cauza importanței semnificative a ratei de dezabonare a clienților în cadrul unei afaceri, părțile interesate investesc mai mult timp și efort pentru a afla care este rațiunea în cadrul organizațiilor lor, cum pot prezice cu exactitate tipul de clienți existenți care pot înceta să mai facă afaceri cu ei și ce pot face pentru a minimiza rata de dezabonare a clienților.
Cel mai bun mod de a evita dezabonarea clienților este să vă cunoașteți clienții, iar cel mai bun mod de a vă cunoaște clienții este prin intermediul datelor istorice și a celor noi.
În acest articol, vom trece în revistă câteva date despre consumatori și vom vedea cum putem valorifica informațiile din date și modelarea predictivă pentru a îmbunătăți retenția clienților. În analiza noastră, vom folosi Python și o varietate de algoritmi de învățare automată pentru predicție.
Primul nostru set de date despre clienți provine de la o companie de carduri de credit, unde putem examina atributele clienților, cum ar fi sexul, vârsta, vechimea, vechimea, soldul, numărul de produse la care sunt abonați, salariul lor estimat și dacă au oprit sau nu abonamentul.
Când creăm modelul și ne uităm la acuratețe, vedem deja că scorul de acuratețe pentru Support Vector Machine este mai mic decât Random Forest Classification.
Când creăm modelul și ne uităm la acuratețe, vedem deja că scorul de acuratețe pentru Support Vector Machine este mai mic decât cel pentru Random Forest Classification.
Modelul prezice 567 de Adevărate Negative, 6 False Pozitive, 83 de False Negative, 11 Adevărate Pozitive. Chiar dacă numărul de False Positive a scăzut ușor, True Positives este semnificativ mai mic în comparație cu RandomForestClassifier.
Atât scorul de precizie (0,647), cât și scorul de rechemare (0,11) sunt mult mai mici decât cele ale Clasificatorului aleatoriu. Aria sub curba roc (auc) este de 0,83, care este aceeași cu cea a clasificatorului Random Forest. Cea mai bună opțiune pentru gradul Support Vector Machine este 1. (care în prezent este setat ca valoare implicită de 3).
Bazându-ne pe cele două modele predictive pe care le-am creat, primul model pe care l-am creat cu Random Forest Classifier ar fi o alegere mai bună. Putem, de asemenea, să reglăm acest model și să îl îmbunătățim prin actualizarea n_estimator și prin eliminarea variabilei de stare din setul de caracteristici pentru o predicție mai bună.
Cu ajutorul informațiilor existente despre consumatori prin intermediul datelor, companiile pot prezice posibilele nevoi și probleme ale clienților, pot defini strategii și soluții adecvate față de acestea, pot satisface așteptările acestora și le pot păstra afacerea. Pe baza analizei și modelării predictive, companiile își pot concentra atenția cu o abordare țintită prin segmentare și oferindu-le soluții personalizate. Analiza modului și a momentului în care are loc dezabonarea în ciclul de viață al clienților cu serviciile va permite companiei să vină cu măsuri mai preventive.
.