ARTÍCULO
TITULO

Penerapan Naive Bayes untuk Mengurangi Data Noise pada Klasifikasi Multi Kelas dengan Decision Tree

Al Riza Khadafy    
Romi Satria Wahono    

Resumen

Selama beberapa dekade terakhir, cukup banyak algoritma data mining yang telah diusulkan oleh peneliti kecerdasan komputasi untuk memecahkan masalah klasifikasi di dunia nyata. Di antara metode-metode data mining lainnya, Decision Tree (DT) memiliki berbagai keunggulan diantaranya sederhana untuk dipahami, mudah untuk diterapkan, membutuhkan sedikit pengetahuan, mampu menangani data numerik dan kategorikal, tangguh, dan dapat menangani dataset yang besar. Banyak dataset berukuran besar dan memiliki banyak kelas atau multi kelas yang ada di dunia memiliki noise atau mengandung error. Algoritma pengklasifikasi DT memiliki keunggulan dalam menyelesaikan masalah klasifikasi, namun data noise yang terdapat pada dataset berukuran besar dan memiliki banyak kelas atau multi kelas dapat mengurangi akurasi pada klasifikasinya. Masalah data noise pada dataset tersebut akan diselesaikan dengan menerapkan pengklasifikasi Naive Bayes (NB) untuk menemukan instance yang mengandung noise dan menghapusnya sebelum diproses oleh pengklasifikasi DT. Pengujian metode yang diusulkan dilakukan dengan delapan dataset uji dari UCI (University of California, Irvine) machine learning repository dan dibandingkan dengan algoritma pengklasifikasi DT. Hasil akurasi yang didapat menunjukkan bahwa algoritma yang diusulkan DT+NB lebih unggul dari algoritma DT, dengan nilai akurasi untuk masing-masing dataset uji seperti Breast Cancer 96.59% (meningkat 21,06%), Diabetes 92,32% (meningkat 18,49%), Glass 87,50% (meningkat 20,68%), Iris 97,22% (meningkat 1,22%), Soybean 95,28% (meningkat 3,77%), Vote 98,98% (meningkat 2,66%), Image Segmentation 99,10% (meningkat 3,36%), dan Tic-tac-toe 93,85% (meningkat 9,30%). Dengan demikian dapat disimpulkan bahwa penerapan NB terbukti dapat menangani data noise pada dataset berukuran besar dan memiliki banyak kelas atau multi kelas sehingga akurasi pada algoritma klasifikasi DT meningkat.

 Artículos similares

       
 
Sinta Sulistiani     Pág. 15 - 21
Penelitian ini bertujuan untuk mengetahui pengaruh kualitas produk terhadap kepuasan pelanggan pada Kentucky Fried Chicken (KFC) Cabang Meruya. Metode yang digunakan adalah explanatory research dengan sampel sebanyak 96 responden. Teknik analisis menggun... ver más

 
Sirajuddin Sirajuddin, Jakariah Jakariah     Pág. 22 - 28
Penelitian ini bertujuan untuk mengetahui pengaruh Pendidikan Kewirausahaan terhadap Minat Berwirausaha Siswa di Pondok Pesantren Al-Manar Cibeuteung Udik. Metode yang digunakan adalah explanatory research dengan sampel sebanyak 29 responden. Teknik anal... ver más

 
Sukardi Sukardi     Pág. 29 - 42
Penelitian ini bertujuan untuk mengetahui pengaruh motivasi dan disiplin kerja terhadap produktivitas karyawan pada PT. Capital Life Indonesia di Jakarta. Suatu organisasi dapat berjalan efektif apabila fungsi-fungsi manajemen seperti perencanaan (planni... ver más

 
Iis Noviyanti, Denok Sunarsi, Hadion Wijoyo     Pág. 43 - 54
Penelitian ini bertujuan untuk mengetahui pengaruh harga dan lokasi terhadap keputusan pembelian pada Alfamart Cabang Cipondoh. Metode yang digunakan adalah explanatory research dengan teknik analisis menggunakan analisis statistik dengan pengujian regre... ver más

 
Eko Prowoto, Achmad Affandi     Pág. 88 - 98
Penelitian ini bertujuan untuk mengetahui pengaruh employee engagemen terhadap kinerja karyawan, pengaruh komitmen karyawan terhadap kinerja karyawan, Peran organizational citizenship behavior pada pengaruh employee engagemen dan komitmen karyawan terhad... ver más