Data Mining

Data Mining adalah cabang ilmu yang memperlajari bagaimana cara mengolah data yang tidak berarti dan sangat besar menjadi data yang lebih bermanfaat.

WEKA

WEKA adalah sebuah tools machine learning yang cukup powerfull untuk mengolah data mining karena memiliki banyak sekali koleksi algoritma didalamanya.

PHP

PHP adalah sebuah bahasa pemrograman berbasiskan web yang popular.

Database

Database adalah sebuah teknik pembuatan query untuk membuat tabel penyimpanan data yang terstruktur.

Tomcat

Tomcat adalah salah satu web server yang bisa digunakan untuk server pemrograman menggunakan bahasa java.

Friday 14 October 2016

Seleksi Fitur

Seleksi Fitur atau yang sering dikenal dengan Feature Selection pada proses penambangan data (Data Mining) merupakan sebuah proses yang cukup krusial. kenapa disebut cukup krusial?.... sebab pemilihan fitur yang tidak sesuai akan mengakibatkan perolehan nilai akurasi menjadi menurun. Proses seleksi fitur bekerja dengan memilih fitur-fitur yang relevan dan menghilangkan fitur yang tidak relevan dalam sebuah proses analisis. Seperti yang terlihat pada gambar, awalnya fitur yang dimiliki adalah 1000 setelah dilakukan proses seleksi fitur maka fitur berkurang dan menjadi 500 fitur yang relevan.

Proses seleksi fitur dapat dilakukan dengan berbagai metode, sehingga perlu mencobanya untuk mengetahui metode mana yang memiliki kecocokan dengan data yang digunakan. Dalam penggunaan seleksi fitur terdapat teknik yang sering digunakan yaitu ranking selection dan subset selection.

Rangking Selection merupakan sebuah fitur yang bekerja dengan memberikan rangking pada fitur-fitur dan mengabaikan fitur yang tidak memiliki relevansi. Proses rangking selection menentukan besarnya tingkat perangkingan secara independent antara fitur-fitur yang digunakan.

Subset Selection merupakan sebuah teknik seleksi yang menggunakan suatu set fitur yang diangap sebagai optimal feature. terdapat beberapa teknik yang dapat difunakan  pada proses subset selection yaitu filter, wrapper, dan embeded.

  • Fitur Seleksi Filter merupakan sebuah teknik seleksi fitur yang menggunakan Intrinsic Statistical Properties dari sebuah data. Metode ini memanfaatkan salah satu dari filter yang ada, seperti Individua Merit, Fhiser, Kullback-Leiber, dll. Kelemahan dari teknik ini adalah akurasi yang didapatkan tidak begitu baik, namun memiliki waktu komoputasi yang cepat,
  • Fitur Seleksi Wrapper merupakan sebuah teknik seleksi fitur yang melakukan pemilihan dan pemodelan secara bersamaan. Seleksi fitur pada tipe ini harus dilakukan pemilihan subset sebelum menentukan subset dengan rangking terbaik. Metode yang sering digunakan pada teknik ini seperti Algoritme Genetika, Greedy Search, Hill Climbing, dll.
  • Fitur Seleksi Embeded merupakan sebuah fitur yang bekerja dengan memanfaatkan suatu pembelajaran dari machine learning untuk proses seleksi fitur. Teknik ini akan secara otomatis menghilangkan fitur yang dianggap kurang penting atau berpengaruh. Metode yang sering digunakan dalam teknik ini adalah Ramdom Forests, J48, dll.
luvne.com ayeey.com cicicookies.com mbepp.com kumpulanrumusnya.comnya.com tipscantiknya.com