Rabu, 23 Januari 2019

Ini dia model yang bisa dipakai.

MODEL  di sini bahkan bisa dijadikan experimen, tidak cuma bisa dicoba coba, diperlakukan apapun dia tidak akan komplain, dan yang mengherankan lagi ... tidak mau dibayar alias gratis. Trus pertanyaanya siapa model yang bisa dipakai tsb? Simak paparan saya, untuk menepati janji melanjutkan postingan kemarin.

Model tersebut adalah Model Machine Learning dari Studio Azure Machine Learning Microsof, di sini akan dicoba menganalisa dataset yang sudah dipersiapkan, untuk menguji 5 model Machine Learning sbb:
1. Bayesian Linear Regression
2. Neural Network Regression
3. Boosted Decision Tree Regression
4. Linear Regression
5. Decision Forest Regression
Model Bayesian Linear Regression dan Neural Network Regression sudah dicoba dipostingan sebelumnya, hasilnya Neural Network Regression lebih unggul dari Bayesian Linear Regression, apakah model Neural Network Regression masih unggul, jika data diatas duji lagi dengan model Boosted Decision Tree Regression, Linear Regression dan Decision Forest Regression? Ikuti langkah di bawah ini:
Langkahnya sama seperti postingan terdahulu, 
1. Upload Modul data
2. Split data, recomended 50% training data 50% test data
3. Modul Machine Learning
4. Modul Train Model, di panel properties, dikeluarkan variable lable(medv), sebagai target.
5. Modul Score Model
6. Evaluate Model
7. Executed R Script modul
8. Masing masing dihubungkan dengan Modul Add Row
Note:
Perlu modifikasi R script di panel properties sbb:
Untuk Bayesian Linear Regressian dan Decision Forest Regression  model, ketik R script di bawah ini(Script 1)
Script 1
Untuk Neural Network Regression, Boosted Decision Tree Regression dan Linear Regression, ketik R script (Script 2)
Script 2

9. Lakukan prosedure 1 sampai 7 untuk setiap modul machine learning, jadi ada total 5 modul yang akan diexecusi di Studio Machine Learning. Diagram lengkap modelnya ada di Screen 1
Screen 1
10. Klik Run
11. Upload to Web


Screen 2

12. Kesimpulan
12.1. Ternyata model yang unggul adalah Boosted Decision Tree Regression, dengan nilai
 Coefficient Determination = 0.898651, dan RMSE = 2.790232, lihat Screen 2.
12.2. Jadi dari kelima model machine learning yang dicoba di sini, yang terbaik adalah model Boosted Decision Tree Regression.
12.3. Eksekusi 5 model di atas di Studio Azure Machine Learning hanya makan waktu kira2-kira 3 menit. 

Referensi
3. Github
4. Dropbox
5. H2O




Selasa, 22 Januari 2019

Pilih model yang mana?

Analisa data itu mudah! yang susah adalah menentukan hasilnya itu valid apa tidak, sesuai apa tidak. Mengatasi hal tersebut terpaksa kita harus membandingkan beberapa model yang kita pakai. 
Di sini akan dicoba membandingan antara Model Bayesian Linear Regression dengan Neural Network Regression, dengan memakai fasilitas Studio Microsoft Machine Learning. Jadi tidak perlu mebuat  coding R satu persatu, tapi bagi yang ingin memperdalam bisa email saya.
Sebelum memulai, tentunya harus punya account di Studio Microsoft Machine Learning, bisa daftar disini. Selanjutnya ikuti langkahnya sbb:



1. Preparation 
1.1.Data preparation, use data Boston , from Boston Housing Values in Suburbs of Boston, Source:Belsley D.A., Kuh, E. and Welsch, R.E. (1980) Regression Diagnostics. Identifying Influential Data and Sources of Collinearity. New York: Wiley.
1.2. Use modul Split Data, split data randomly 50% train data and 50% test data

Screen1, Boston raw data

3. Model 
3.1. Bayesian Linear Regression 
3.2. Neural Network Regression

Screen 2, Flowchart lengkap

4. Train Model
4.1. Use Train Model modul, connect to modul Bayesian, connect to Modul Split Data 
4.2. Use Score Model modul, connect right bottom to right bottom Modul Split Data 
4.3. Modul Evaluate 
5. Execute R Script
5.1. Change the R script in Properties panel for Bayesian Linear Regression
5.2. Connect to Modul Add Rows

Catatan
Di modul R Script, di bagian Properti Panel, harus dimasukkan R script yang baru, lihat di
Screen 3.
Screen 3

Screen 3, Script R yang harus dimasukkan ke Modul Bayesian Linear Regression.
Begitu juga di modul Neural Network Regression, di Panel Properties harus dimasukkan R script baru ada di Screen 4
Screen 4

Screen 4. Script R yang harus dimasukkan ke Modul Neural Net Regression.

6. Neural Network Regression
6.1. Follow the procedure from Preparation to Add Rows, for the Neural Network Regression. 
6.2. Connect the Add Rows module Execute R Script in Neural Network Regression. 
7. Result. 
7.1. Run all application 
7.2. Click Visualize table,
7.3. Comparing which is better, Bayesian Linear Regression or Neural Network Regression.
7.4. Check Screen 5.
7.5. Neural Network Regression  has RMSE  3.609129(less than RMSE of Bayesia Network Regression ) and Coefficient determination 0.830432 bigger than Bayesian Linear Regression.

Screen 5.

8. Conclusion
8.1. Neural Network Regression better than Bayesian Linear Regression Model.
8.2. Not absolutely true, in the next I will compare this result with model Boosted Decicion Tree Regression, Linear Regression and Decicion Forest Regression.

References
2. Github
4. Dropbox
5. H2O






Senin, 21 Januari 2019

Berapakah harga yang pantas?


Berapakah harga yang pantas?

Pertanyaan itu muncul setiap saat kita mendapat penawaran dari penjual. Menentukan harga sebuah produk itu gampang apabila variable yang mempengaruhi produk tsb sedikit, tapi jika banyak bagaimana?
Kami akan berikan ilustrasi data yang diambil dari Housing Values in Suburbs of Boston, Source:Belsley D.A., Kuh, E. and Welsch, R.E. (1980) Regression Diagnostics. Identifying Influential Data and Sources of Collinearity. New York: Wiley.

Cara mudah cepat , murah dan akurat  untuk menjawab pertanyaan di atas.

Gunakan  fasilitas Azure Machine Learning dari microsoft, memberikan fasilitas free 10gb, dan dapat
mengeksekusi max 1000 line script. Dengan tool machine learning yang cukup memadai untuk mengolah data yang ada, pilihan bahasa bisa R atau Python. Microsoft sangat murah hati, dibandingkan dengan AWS (Amazone Web Service) yang kenakan charge/jam/dollar!.
Sangat menarik terutama, bagi UKM, startup, ecomerce, dan siapa saja ingin memulai bisnis hanya bermodal laptop saja! karena anda tidak perlu  programmer.

Data Boston
Dimensi data Boston terdiri 506 baris dan 14 kolom
crim    : criminal ratio/town
zn       : population density
indus  : proportion of non-retail business acres per town.
chas    : Charles River dummy variable (= 1 if tract bounds river; 0 otherwise).
nox     : nitrogen oxides concentration (parts per 10 million).
rm       : average number of rooms per dwelling.
age      : proportion of owner-occupied units built prior to 1940.
dis       : weighted mean of distances to five Boston employment centres.
rad      : index of accessibility to radial highways.
tax      : full-value property-tax rate per \$10,000.
ptratio: pupil-teacher ratio by town.
black  : 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town.
lstat    : lower status of the population (percent).
medv  : median value of owner-occupied homes in \$1000s



Gb1. Ilustrasi data dari excel

Eksekusi di Azure Machine Learning
1. Buat account di sini Azure
2. Masuk studio.studio.azureml.net
3. Upload data Boston (Gb.1)
4. Cleansing data Boston
5. Spliting data Boston, recomended, 75% train data, 25%test data
6. Ambil modul Machine Learning, tool Regression
7. Klik modul Train Model
8. Hubungkan Train Model dengan modul Regression
9. Hubungkan port kanan modul split data dengan Modul Train
10. Run
11. Klik modul Score untuk menguji(Gb.2)

Gb.2

12. Upload di Web (Gb.3)


Gb.3

13. Test hasil
Gb. 4

Kesimpulan. 
1. Lihat data Excel Boston baris 3(GB.1, nilai medv = 34.7, setelah ditest ternyata hanya 30.520, jadi nilai nya overprice. Lihat(Gb.4)
2. Bisa juga nilanya setelah distest underprice, bisa dicoba sendiri.
3. Hal tersebut terjadi karena tiap variable punya respon sendiri, terhadap price/medv.
5. Jadi dengan analisa sederhana ala DATA SCIENTIST bermanfaat bukan?
6. Machine learning memudahkan hidup kita.

Referensi:
2. Github 




Minggu, 20 Januari 2019

Mencoba Azure Machine Learning

Prediksi harga harga mobil dari berbagai merk, rational atau tidak.

1.Data preparation
1.1. Data bisa diambil dari dataset Azure Machine Learning
1.2. Data dari luar dataset Azure Machine Learning

2. Menggunakan Machine Learning dari Azure Machine Learning
2.1. Upload data ke dataset Azure Machine Learning
2.2. Data preparation, cleansing dll.
2.3. Split data, data dibagi dua, train data dan test data
2.4. Gunakan Machine larning, pilih linear regression
2.5. Gunakan modul Train model
2.6. Hubungkan Train model dengan modul Linear Regression
2.7. Hubungkan juga Train Model dengan Split Data
2.8. Gunakan Modul Score
2.9. Hubungkan Train modul dengan Score Modul
2.10. Hubungkan pula Score Modul dengan Split Data
2.11. Klik tombol Run, tunggu sebentar
2.12. Klik tomol bawah Score Modul, pilih Visualised
2. 13.Terlihat data Score Lable, bandingkan dengan Aktual price

3. Upload di Web 
3.1. Buka set up Web Service
3.2. Test Web Servise

4. Kesimpulan
4.1. Dengan Test Web Servise, akan terlihat apakah harga mobil tsb rational atau tidak
4.2. Dengan menggunakan Azure Machine Learning, tidak perlu membuat koding.
4.3. Sekarang Microsoft Azure , menyediakan free account hampir 10GB, dengan 100 modul/experiment, bandinkan jika menggunakan AWS(Amazone Web Servisce) akan kena charge/jam.

Referensi:




Kapan Puncak Covid19 di Indonesia ?

Prediksi Covid19, kapan mencapai puncaknya? Selamat Idhul Fitri from Home, menjawab pertanyaan kapan covid19 mencapai puncaknya? ...