WEKA
Selamat siang kawan, kali ini saya akan membahas
WEKA. Apa seh WEKA? Weka adalah tools atau aplikasi data mining, kenapa WEKA? Simple
sekali jawabnya, karena saya tahunya weka, heee…
okey, lanjut.
WEKA berasal dari Selandia Baru (New Zealand) yang dikembangkan oleh Universitas Waikato. Weka adalah tools yang cukup tangguh dan mumpuni, kenapa? Karena weka memiliki koleksi berbagai macam jenis algoritma machine learning yang digunakan untuk melakukan generalisasi atau formulasi dari dataset atau sample data.
WEKA berasal dari Selandia Baru (New Zealand) yang dikembangkan oleh Universitas Waikato. Weka adalah tools yang cukup tangguh dan mumpuni, kenapa? Karena weka memiliki koleksi berbagai macam jenis algoritma machine learning yang digunakan untuk melakukan generalisasi atau formulasi dari dataset atau sample data.
Yah, meskipun
weka cukup unggul di dalam variasi algoritma yang dikumpulkan, namum tetap
saja peran user masih number one, kenapa demikian? Itu semua karena secanggih
apapun weka jika masukan datanya tidak sesuai dengan format, maka weka tidak
akan bisa melakukan proses learning. Pada data mining peran data sangatlah
penting, sebab keakuratan hasil dari proses ditentukan dari dataset atau
inputan yang baik. Seperti apa inputan yang baik itu? Inputan bisa dikatakan
baik jika sudah tidak memiliki data noise.
Weka mengenal
dua format, yaitu CSV dan arff, yang pertama adalah CSV. Apakah sudah pada tau
CSV itu apa? Hm…. Wah, ternyata yang tahu sudah banyak ya. Okelah saya ulas
kembali CSV (Comma Dellimited) "kalau di exel" adalah format yang sering diminati
para peneliti karena setiap record data dipisahkan dengan dengan koma (,) atau
titik koma (;) yang bisa dibuka mengguanakan text editor seperti notepad,
wordpad, exel. Sedangkan ARFF adalah format yang dimengerti oleh machine
learning weka untuk proses tahap selanjutnya, kenapa demikian? Karena memang
format itu yang dimengerti, hehe…
Weka mengenal 4
jenis tipe data yatu numeric, nominal spesification, string dan date [<date-format>].
Sudahkah kalian tau maksudnya? Oke kita bahas, yang pertama adalah numeric,
tipe numeric adalah untuk merepresentasikan bilangan bulat atau real. Yang kedua
adalah nominal, bilangan yang paling sederhana digunakan untuk
merepresentasikan angka yang hanya diartikan sebagai label dan tidak menunjukan
suatu tingkatan apapun. Yang ketiga adalah string, sudah pasti pada tahu
tipe ini, tipe ini adalah diperuntukan merepresentasikan data dengan tipe
string atau kata, kemudia tipe ke empat yaitu date, dalam ilmu pemrograman date
adalah penanggalan, jujur saja tipe ini belum pernah saya sentuh, atau kalaupun
sudah pernah mungkin saya tidak sadar.
Eng ing eng…. Daripada
kepanjangan kurang menarik atau kurang jelas, mending langsung praktek saja. Coba
lihat kesini deh ya, heh…. Pengoperasian weka
Okey, sedikit
dari saya. Semoga yang sedikit ini menjadi amal yang tidak pernah putus, edisi
mencari pahala.
0 Komentar:
Post a Comment