Monday 23 March 2015

Belajar Menggenal Weka Lebih Dalam

WEKA
Selamat siang kawan, kali ini saya akan membahas WEKA. Apa seh WEKA? Weka adalah tools atau aplikasi data mining, kenapa WEKA? Simple sekali jawabnya, karena saya tahunya weka, heee…

okey, lanjut.
WEKA berasal dari Selandia Baru (New Zealand) yang dikembangkan oleh Universitas Waikato. Weka adalah tools yang cukup tangguh dan mumpuni, kenapa? Karena weka memiliki koleksi berbagai macam jenis algoritma machine learning yang digunakan untuk melakukan generalisasi atau formulasi dari dataset atau sample data.

Yah, meskipun weka cukup unggul di dalam variasi algoritma yang dikumpulkan, namum tetap saja peran user masih number one, kenapa demikian? Itu semua karena secanggih apapun weka jika masukan datanya tidak sesuai dengan format, maka weka tidak akan bisa melakukan proses learning. Pada data mining peran data sangatlah penting, sebab keakuratan hasil dari proses ditentukan dari dataset atau inputan yang baik. Seperti apa inputan yang baik itu? Inputan bisa dikatakan baik jika sudah tidak memiliki data noise.

Weka mengenal dua format, yaitu CSV dan arff, yang pertama adalah CSV. Apakah sudah pada tau CSV itu apa? Hm…. Wah, ternyata yang tahu sudah banyak ya. Okelah saya ulas kembali CSV (Comma Dellimited) "kalau di exel" adalah format yang sering diminati para peneliti karena setiap record data dipisahkan dengan dengan koma (,) atau titik koma (;) yang bisa dibuka mengguanakan text editor seperti notepad, wordpad, exel. Sedangkan ARFF adalah format yang dimengerti oleh machine learning weka untuk proses tahap selanjutnya, kenapa demikian? Karena memang format itu yang dimengerti, hehe…

Weka mengenal 4 jenis tipe data yatu numeric, nominal spesification, string dan date [<date-format>]. Sudahkah kalian tau maksudnya? Oke kita bahas, yang pertama adalah numeric, tipe numeric adalah untuk merepresentasikan bilangan bulat atau real. Yang kedua adalah nominal, bilangan yang paling sederhana digunakan untuk merepresentasikan angka yang hanya diartikan sebagai label dan tidak menunjukan suatu tingkatan apapun. Yang ketiga adalah string, sudah pasti pada tahu tipe ini, tipe ini adalah diperuntukan merepresentasikan data dengan tipe string atau kata, kemudia tipe ke empat yaitu date, dalam ilmu pemrograman date adalah penanggalan, jujur saja tipe ini belum pernah saya sentuh, atau kalaupun sudah pernah mungkin saya tidak sadar.

Eng ing eng…. Daripada kepanjangan kurang menarik atau kurang jelas, mending langsung praktek saja. Coba lihat kesini deh ya, heh…. Pengoperasian weka


Okey, sedikit dari saya. Semoga yang sedikit ini menjadi amal yang tidak pernah putus, edisi mencari pahala. 

0 Komentar:

luvne.com ayeey.com cicicookies.com mbepp.com kumpulanrumusnya.comnya.com tipscantiknya.com