Senin, 21 Januari 2019

Berapakah harga yang pantas?


Berapakah harga yang pantas?

Pertanyaan itu muncul setiap saat kita mendapat penawaran dari penjual. Menentukan harga sebuah produk itu gampang apabila variable yang mempengaruhi produk tsb sedikit, tapi jika banyak bagaimana?
Kami akan berikan ilustrasi data yang diambil dari Housing Values in Suburbs of Boston, Source:Belsley D.A., Kuh, E. and Welsch, R.E. (1980) Regression Diagnostics. Identifying Influential Data and Sources of Collinearity. New York: Wiley.

Cara mudah cepat , murah dan akurat  untuk menjawab pertanyaan di atas.

Gunakan  fasilitas Azure Machine Learning dari microsoft, memberikan fasilitas free 10gb, dan dapat
mengeksekusi max 1000 line script. Dengan tool machine learning yang cukup memadai untuk mengolah data yang ada, pilihan bahasa bisa R atau Python. Microsoft sangat murah hati, dibandingkan dengan AWS (Amazone Web Service) yang kenakan charge/jam/dollar!.
Sangat menarik terutama, bagi UKM, startup, ecomerce, dan siapa saja ingin memulai bisnis hanya bermodal laptop saja! karena anda tidak perlu  programmer.

Data Boston
Dimensi data Boston terdiri 506 baris dan 14 kolom
crim    : criminal ratio/town
zn       : population density
indus  : proportion of non-retail business acres per town.
chas    : Charles River dummy variable (= 1 if tract bounds river; 0 otherwise).
nox     : nitrogen oxides concentration (parts per 10 million).
rm       : average number of rooms per dwelling.
age      : proportion of owner-occupied units built prior to 1940.
dis       : weighted mean of distances to five Boston employment centres.
rad      : index of accessibility to radial highways.
tax      : full-value property-tax rate per \$10,000.
ptratio: pupil-teacher ratio by town.
black  : 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town.
lstat    : lower status of the population (percent).
medv  : median value of owner-occupied homes in \$1000s



Gb1. Ilustrasi data dari excel

Eksekusi di Azure Machine Learning
1. Buat account di sini Azure
2. Masuk studio.studio.azureml.net
3. Upload data Boston (Gb.1)
4. Cleansing data Boston
5. Spliting data Boston, recomended, 75% train data, 25%test data
6. Ambil modul Machine Learning, tool Regression
7. Klik modul Train Model
8. Hubungkan Train Model dengan modul Regression
9. Hubungkan port kanan modul split data dengan Modul Train
10. Run
11. Klik modul Score untuk menguji(Gb.2)

Gb.2

12. Upload di Web (Gb.3)


Gb.3

13. Test hasil
Gb. 4

Kesimpulan. 
1. Lihat data Excel Boston baris 3(GB.1, nilai medv = 34.7, setelah ditest ternyata hanya 30.520, jadi nilai nya overprice. Lihat(Gb.4)
2. Bisa juga nilanya setelah distest underprice, bisa dicoba sendiri.
3. Hal tersebut terjadi karena tiap variable punya respon sendiri, terhadap price/medv.
5. Jadi dengan analisa sederhana ala DATA SCIENTIST bermanfaat bukan?
6. Machine learning memudahkan hidup kita.

Referensi:
2. Github 




Tidak ada komentar:

Posting Komentar

Kapan Puncak Covid19 di Indonesia ?

Prediksi Covid19, kapan mencapai puncaknya? Selamat Idhul Fitri from Home, menjawab pertanyaan kapan covid19 mencapai puncaknya? ...