Data Mining

Data Mining adalah cabang ilmu yang memperlajari bagaimana cara mengolah data yang tidak berarti dan sangat besar menjadi data yang lebih bermanfaat.

WEKA

WEKA adalah sebuah tools machine learning yang cukup powerfull untuk mengolah data mining karena memiliki banyak sekali koleksi algoritma didalamanya.

PHP

PHP adalah sebuah bahasa pemrograman berbasiskan web yang popular.

Database

Database adalah sebuah teknik pembuatan query untuk membuat tabel penyimpanan data yang terstruktur.

Tomcat

Tomcat adalah salah satu web server yang bisa digunakan untuk server pemrograman menggunakan bahasa java.

Thursday 26 February 2015

Belajar Memahami Proses N-Gram

N-Gram......
Pertama kali mendengarnya, terdengar asing ditelinga saya dan saya berfikir, kok namanya seperti timbangan ya, hehe...   Namun lama kelamaan menjadi tuntutan bagi saya. Sesuatu yang mau tidak mau harus saya pelajari untuk mendukung studi saya.hehe....

N-Gram adalah sebuah proses pemecah kata yang tergolong popular. N dalam n-gram bisa diberi nilai secara acak sesuai dengan keinginan pengguna. Bobot pada N akan digunakan untuk memecah sebuah kalimat menjadi kecil-kecil sesuai dengan pemberian bobot pada N. Pada gambar diatas adalah proses N-Gram dengan jumlah N sebanyak 3 (Trigram).

Proses pemberian bobot pada N-Gram sangatlah bervariatif tergantung pada data yang akan diproses, bobot pada N juga akan mempengaruhi keakuratan pada hasil learning, jadi memilih bobot yang tepat adalah sebuah proses yang bisa dikatakan sulit. Karena salah memberikan bobot hasil yang didapat tidak akan sesuai harapan, bahkan mendekati harapan.

Pemrosesan n-gram
Pada pemrosesan n-gram akan diberikan contoh dengan kata "aku sayang kamu", maka akan diproses sebagai berikut:
Bobot
Hasil
Unigram
a, k, u, s, a, y, a, n, g, k, a, m, u
Bigram
ak, ku, us, sa, ay, ya, an, ng, gk, ka, am, mu
rigram
aku, kus, usa, say, aya, yan, ang, ngk, gka, kam, amu
Dst….


Dari hasil yang didapat akan dilakukan proses pembobotan dari frekuensi kemunculannya, semakin besar kemunculan suatu kata maka tingkat similarity terhadap dokumen akan semakin baik.

Pengertian Jaringan Komputer

Jaringan Komputer memiliki pengertian yaitu sekumpulan perangkat komputer yang saling terhubung satu dengan yang lainnya. Dalam sebuah jaringan komputer dimungkinkan untuk saling bertukar informasi antara satu perangkat dengan perangkat yang lain dengan ketentuan bahwa mereka saling terkoneksi atau masih dalam satu jaringan. Hal yang biasa dilakukan dalam sebuah jaringan adalah saling bertukar file, menggunakan resource dari komputer lain, melakukan interaksi seperti chating, saling berkirim email dan melakukan pencarian di laman web atau browsing. Namun untuk bisa melakukan semua aktifitas tersebut setiap perangkat haruslah bisa melakukan sebuah service dengan sistem client-server. Server adalah sebuah perangkat yang menerima permintaan dan memberikan apa yang diminta oleh client, sedangkan Client adalah sebuah perangkat yang melakukan permintaan terhadap server. 

Berbagai macam perangkat jaringan komputer yang harus diketahui nama dan fungsinya:
  • Komputer/Laptop : Perangkat ini difungsikan untuk menjalankan web browser dan aplikasi lainnya yang berguna untuk kelancaran jaringan.
  • Network Interface Card (NIC) : Perangkat jaringan ini digunakan untuk identifikasi perangkat pada sebuah jaringan, karena perangkat sebenarnya berinteraksi dengan nomor unik seperti MAC address, jadi keberadaan NIC ini sangatlah vital dalam jaringan komputer.
  • Switch/Hub : Perangkat yang berfungsi untuk menjadi terminal antara perangkat satu dengan perangkat yang lainnya, seperti yang terlihat pada gambar diatas. Namun hub memiliki kekurangan yaitu tidak dapat mengetahui alamat yang akan dituju sehingga dalam penyampaian pesan masih melakukan broadcast terhadap semua port yang ada dan membuat lalu lintas semakin sibuk dan mudah terjadi penyadapan, sedangkan switch terbilang lebih cerdas karena dapat mencegah terjadinya collision domain (tabrakan) antara data karena switch dapat mengenali alamat yang dituju dan membuatkan jalur yang berbeda pada setiap portnya.
  • Repeater : Perangkat yang berfungsi untuk meneruskan koneksi jaringan (mengatasi loss koneksi saat kemampuan transfer telah mencapai batas jarak maksimal).
  • Bridge : Perangkat tersebut memiliki fungsi sama dengan repeater, namun bridge lebih fleksible dan cerdas. Dengan kemampuan dapat menghubungkan Eth baseband dengan Eth broadband selain itu juga bisa menghubungkan tipe kabel yang berbeda bahkan topologi yang berbeda. Bridge juga memiliki kemampuan untuk mengetahui alamat masing-masing komputer pada sisi jaringan.
  • Router : Perangkat ini bekerja sebagai penghubung antar dua jaringan atau lebih untuk dengan tujuan menenruskan data dari jaringan satu ke jaringan yang lain. Router dikenal memiliki Dynamic Host Configuration Protocol (DHCP) dengan fasilitas ini dimungkinkan untuk membagi IP address kepada komputer yang terkoneksi, router juga dapat digunakan untuk menghubungkan antara jaringan lokal dengan publik menggunakan Network Address Translation (NAT) agar dapat saling berinteraksi.

Jaringan Komputer juga dibedakan menjadi beberapa skala, karena setiap skala memiliki pengaturan yang berbeda, seperti dibawah ini :
  • Local Area Networ (LAN)
  • Metropolitan Area Network (MAN)
  • Wide Area Network (WAN)
Ketiga skala yang digunakan tersebut mewakili skala yang dicakupnya, seperti LAN. LAN mencakup skala lokal saja, biasanya terdiri atas satu atau dua gedung dengan jarak yang berdekatan. LAN biasanya dibangun lebih simple karena hanya bisa memanfaatkan beberapa perangkat dan pengaturan yang tidak begitu rumit.
Cakupan yang kedua adalah MAN, seperti dengan nama yang disandangnya, MAN memiliki cakupan antar kota atau daerah, cakupan ini sedikit lebih luas dengan tingkat pengaturan juga sedikit lebih rumit. Contoh dari jaringan MAN ini adalah seperti Internet Service Provider (ISP).
Cakupan yang ketiga adalah WAN, dengan adanya jaringan WAN ini kita semua dapat berinteraksi dengan seluruh penjuru dunia, sperti layanan Google yang bisa diakses di indonesia. Internet adalah salah satu layanan WAN yang bisa kita ketahui.


Sekian dulu coretan saya, hanya sekedar menulis dan berbagi karena sudah terdapat banyak tulisan yang membahas masalah tersebut, hehehe... Biar saya juga tidak lupa dengan ilmu yang pernah saya dapatkan. Oke sampai jumpa dicoretanku berikutnya.....

Tuesday 24 February 2015

Pengertian Sederhana Tentang Data Mining

Hai sobat pembaca yang budiman, dalam benak sobat sekalian pasti pernah bertanya, Apa itu Data Mining? Apa kegunaan Data Mining? Bagaimana Proses penggalian data dalam Data Mining?hehe....
Saya pernah mendapatkan tugas tersebut dan saya tertarik untuk meneliti.

Data Mining sering dikenal dengan sebutan penambangan data, terkadang juga sering disangkut pautkan dengan data warehouse yang sebernarnya berbeda.
Data mining merupakan sebuah proses ekstraksi data untuk menarik sebuah pola dari data yang memiliki jumlah sangat besar. Pola yang ditarik dalam proses data mining haruslah memiliki kriteria menarik. Sebuah pola yang di dapatkan dari proses mining bisa dikatakan menarik karena belum diketahui sebelumnya, implisit dan berguna.

Data mining ada karena terlalu banyaknya data yang tersedia seperti basis data perusahaan,e-commerce, data saham, data bioinformatika. Namun tidak tahu harus diapakan data tersebut, data yang dikumpulkan jarang sekali dilihat, mungkin karena data terlalu panjang dan membosankan. Sehingga sering kali keputusan-keputusan yang dibuat berdasarkan data dibuat tidak lagi berdasarkan data, namun lebih cenderung dari pemikiran atau intuisi dari para pembuat keputusan.

Data Mining bekerja dengan menarik sebuah pola.
Langkah-langkah dalam penarikan pola data mining harus melewati beberapa proses yaitu Pembersihan data (menghapus data noise), Integrasi data (menggabungkan sumber data), Pemilihan data (menentukan data relevan), Transformasi Data (mentransformasi data kedalam format yang diperlukan) Evaluasi pola (mengevaluasi pola yang diperoleh), Penyajian pola (merepresentasikan pola kepada pengguna).

Data Mining sering digunakan untuk menyelesaikan masalah seperti pengklasifikasian, clustering, association rule, dll. Sebagai contoh adalah sentiment analisis yang bisa digunakan untuk memprediksi pasar, prediksi wakil rakyat, presiden, ketertarikan, dll. Proses yang dilakukan tidak semudah yang dibayangkan, terdapat beberapa proses untuk bisa mendapatkan hasil yang baik seperti preprocessing, learning dataset, dll.


Semoga bermanfaat.
luvne.com ayeey.com cicicookies.com mbepp.com kumpulanrumusnya.comnya.com tipscantiknya.com