Tampilkan di aplikasi

Discretization: Trik penting dalam analitik dan pemodelan

Majalah Infokomputer - Edisi 07/2018
4 Juli 2018

Majalah Infokomputer - Edisi 07/2018

Discretization seringkali membantu dalam proses eksplorasi dan visualisasi.

Infokomputer
Mempersiapkan data merupakan tahapan yang berkontribusi besar dalam pembuatan predictive modeling. Salah satu prosesnya adalah penyiapan data variabel prediktor, yang banyak juga dikenal sebagai proses feature engineering. Termasuk di dalamnya adalah teknik-teknik reduksi banyaknya variabel, transformasi, penanganan data hilang, serta discretization. Fokus dari tulisan ini adalah tentang discretization.

Secara umum, discretization (disering disebut dengan diskretisasi oleh orang Indonesia) bekerja dengan mengubah variabel numerik (kontinu) menjadi variabel baru yang nilainya berupa selang-selang nilai asal yang tidak tumpang tindih. Meskipun tidak ada ketentuan khusus, umumnya nilai selang yang dibentuk sebanyak empat sampai sepuluh buah.

Karena prosesnya seperti membagi-bagi nilai data ke dalam selang-selang nilai, ada yang menamakannya sebagai proses binning. Sementara itu, dalam pembicaraan tentang skala pengukuran di statistika, proses ini mengubah variabel numerik menjadi variabel kategorik, sehingga disebut juga proses kategorisasi.

Apa keuntungannya? Terdapat beberapa hal yang menjadi alasan mengapa discretization ini perlu dikerjakan pada proses analitik dan pemodelan. Pertama, discretization seringkali membantu dalam proses eksplorasi dan visualisasi. Tanpa ada discretization, terlihat banyak noise yang menganggu sehingga pola-pola umum pada data menjadi tidak begitu terlihat.

Sebagai ilustrasi, grafik pertama pada Gambar 1 menunjukkan proporsi pengguna internet banking untuk berbagai nilai saldo nasabah dibulatkan pada nilai jutaan terdekat. Sementara grafik kedua adalah proporsi pengguna setelah proses discretization. Bisa disebutkan bahwa kecenderungan penggunaan internet banking lebih besar pada nasabah dengan saldo besar jadi lebih mudah terlihat pada grafik kedua.
Majalah Infokomputer di aplikasi myedisi reader pada Android smartphone, tablet, iPhone dan iPad.
Baca selengkapnya di edisi ini

Selengkapnya
DARI EDISI INI