Friday 14 October 2016

Seleksi Fitur

Seleksi Fitur atau yang sering dikenal dengan Feature Selection pada proses penambangan data (Data Mining) merupakan sebuah proses yang cukup krusial. kenapa disebut cukup krusial?.... sebab pemilihan fitur yang tidak sesuai akan mengakibatkan perolehan nilai akurasi menjadi menurun. Proses seleksi fitur bekerja dengan memilih fitur-fitur yang relevan dan menghilangkan fitur yang tidak relevan dalam sebuah proses analisis. Seperti yang terlihat pada gambar, awalnya fitur yang dimiliki adalah 1000 setelah dilakukan proses seleksi fitur maka fitur berkurang dan menjadi 500 fitur yang relevan.

Proses seleksi fitur dapat dilakukan dengan berbagai metode, sehingga perlu mencobanya untuk mengetahui metode mana yang memiliki kecocokan dengan data yang digunakan. Dalam penggunaan seleksi fitur terdapat teknik yang sering digunakan yaitu ranking selection dan subset selection.

Rangking Selection merupakan sebuah fitur yang bekerja dengan memberikan rangking pada fitur-fitur dan mengabaikan fitur yang tidak memiliki relevansi. Proses rangking selection menentukan besarnya tingkat perangkingan secara independent antara fitur-fitur yang digunakan.

Subset Selection merupakan sebuah teknik seleksi yang menggunakan suatu set fitur yang diangap sebagai optimal feature. terdapat beberapa teknik yang dapat difunakan  pada proses subset selection yaitu filter, wrapper, dan embeded.

  • Fitur Seleksi Filter merupakan sebuah teknik seleksi fitur yang menggunakan Intrinsic Statistical Properties dari sebuah data. Metode ini memanfaatkan salah satu dari filter yang ada, seperti Individua Merit, Fhiser, Kullback-Leiber, dll. Kelemahan dari teknik ini adalah akurasi yang didapatkan tidak begitu baik, namun memiliki waktu komoputasi yang cepat,
  • Fitur Seleksi Wrapper merupakan sebuah teknik seleksi fitur yang melakukan pemilihan dan pemodelan secara bersamaan. Seleksi fitur pada tipe ini harus dilakukan pemilihan subset sebelum menentukan subset dengan rangking terbaik. Metode yang sering digunakan pada teknik ini seperti Algoritme Genetika, Greedy Search, Hill Climbing, dll.
  • Fitur Seleksi Embeded merupakan sebuah fitur yang bekerja dengan memanfaatkan suatu pembelajaran dari machine learning untuk proses seleksi fitur. Teknik ini akan secara otomatis menghilangkan fitur yang dianggap kurang penting atau berpengaruh. Metode yang sering digunakan dalam teknik ini adalah Ramdom Forests, J48, dll.

0 Komentar:

luvne.com ayeey.com cicicookies.com mbepp.com kumpulanrumusnya.comnya.com tipscantiknya.com