Rabu, 06 Maret 2019

Model Agnostic Explainers untuk Prediksi Individual

Breakdown - Model Agnostic Explainers untuk Prediksi Individual

Paket breakDown adalah alat model agnostik untuk dekomposisi prediksi dari black box.
Tabel Break Down menunjukkan kontribusi setiap variabel terhadap prediksi akhir. Break Down Plot menyajikan grafis yang simple.
Paket ini cocok untuk biner classification dengan model regresi.


Selasa, 05 Maret 2019

Hemat 4 juta dollar dengan Logistic Regression

Memilih model yang tepat untuk analisa bisnis.

Melanjutkan pembicaraan Exploratory Data Analysis di posting sebelumnya, di sini akan dibahas 2 model regresi, yaitu Logistic Regression dan Random Forest Regression. 2 Model ini banyak dipakai dalam bisnis ecommerce, juga bisnis sejenis lainnya, dimana banyak variable yang saling terkait, sehingga sulit bagi manajemen traditional untuk sekedar menebak variable mana yang paling berpengaruh terhadap kelangsungan bisnisnya.
Map of USA
USA Map

Karena orientasi bisnis adalah profit atas ROI(Rate of Investmen), maka perlu dicari model yang tepat, agar manajemen tidak meraba raba bahkan menebak variable mana yang paling berpengaruh, karena hal tersebut akan beresiko tinggi dan mengeluarkan banyak biaya jika salah dalam mengeksekusi kebijakan.
Di akhir artikel saya akan menyajikan skenario bisnis hipotetis di mana dengan menggunakan model yang tepat  dapat memproyeksikan penghematan tahunan sebesar $4juta dalam biaya retensi pelanggan. Penghematan biaya ini dicapai dengan mengoptimalkan ambang model Logistic Regression. Di sini dibuat beberapa asumsi dasar tentang akuisisi pelanggan dan biaya retensi pelanggan, untuk model perusahaan telekomunikasi.


#---Model prediction
Akan diuji terlebih dahulu antara Model Logistic Regression dan Model Random Forest
dengan test validasi dan Kfold validation untuk menghindari over fitting, berikut ulasannya dalam script R:

Minggu, 03 Maret 2019

Kapan pelanggan anda berhenti?

Sebuah analisa data untuk melihat perilaku pelanggan sebuah perusahaan Telekomunikasi, Sample data telecomunikasi diambil dari IMB Watson Analytic Website.

Layanan berbasis langganan biasanya mendapatkan profit dengan tiga cara berikut:
  1. Mencari pelanggan baru
  2. Menaikkan transaksi pelanggan
  3. Mempertahankan pelanggan existing.
Dalam analisa ini saya akan fokus pada retensi pelanggan, melakukan  eksplorasi data, dengan mengawali cleaning  data.
Beberapa pertanyaan yang berfokus pada segmen pelanggan untuk membantu memandu analisis, seperti siapa saja mudah berhenti berlangganan?, kenapa berhenti? bagaimana caranya agar mereka tidak berhenti? Terus promosi apa yang wajib dilakukan? Setelah pertanyaan ini terjawab, selanjutnya akan dibahas model prediktif churn pelanggan, dengan menggunakan berbagai model machine learning.

Kapan Puncak Covid19 di Indonesia ?

Prediksi Covid19, kapan mencapai puncaknya? Selamat Idhul Fitri from Home, menjawab pertanyaan kapan covid19 mencapai puncaknya? ...