ARTÍCULO
TITULO

Integrasi Metode Information Gain untuk Seleksi Fitur dan AdaBoost untuk Mengurangi Bias pada Analisis Sentimen Review Restoran Menggunakan Algoritma Naive Bayes

Lila Dini Utami    
Romi Satria Wahono    

Resumen

Internet merupakan bagian penting dari kehidupan sehari-hari. Saat ini, tidak hanya dari anggota keluarga dan teman-teman, tetapi juga dari orang asing yang berlokasi diseluruh dunia yang mungkin telah mengunjungi restoran tertentu. Konsumen dapat memberikan pendapat mereka yang sudah tersedia secara online. Ulasan yang terlalu banyak akan memakan banyak waktu dan pada akhirnya akan menjadi bias. Klasifikasi sentimen bertujuan untuk mengatasi masalah ini dengan cara mengklasifikasikan ulasan pengguna ke pendapat positif atau negatif. Pengklasifikasi Naive Bayes adalah tekhnik machine learning yang populer untuk klasifikasi teks, karena sangat sederhana, efisien dan memiliki performa yang baik pada banyak domain. Namun, Naive Bayes memiliki kekurangan yaitu sangat sensitif pada fitur yang terlalu banyak, sehingga membuat akurasi menjadi rendah. Oleh karena itu, dalam penelitian ini menggunakan Information Gain sebagai seleksi fitur dan metode AdaBoost untuk mengurangi bias agar dapat meningkatkan akurasi pengklasifikasi Naive Bayes. Penelitian ini menghasilkan klasifikasi teks dalam bentuk positif dan negatif dari review restoran. Pengukuran berdasarkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur. Validasi dilakukan dengan menggunakan 10 fold cross validation. Sedangkan pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan peningkatan akurasi Naive Bayes dari 73.00% jadi 81.50% dan nilai AUC dari 0.500 jadi 0.887. Sehingga dapat disimpulkan bahwa integrasi metode Information Gain dan AdaBoost pada analisis sentimen review restoran ini mampu meningkatkan akurasi algoritma Naive Bayes.

 Artículos similares

       
 
Vinita Chandani,Romi Satria Wahono,. Purwanto     Pág. 56 - 60
Analisis sentimen adalah proses yang bertujuan untuk menentukan isi dari dataset yang berbentuk teks bersifat positif, negatif atau netral. Saat ini, pendapat khalayak umum menjadi sumber yang penting dalam pengambilan keputusan seseorang akan suatu prod... ver más

 
Suharno Suharno,C. Sudibyo,Bambang P,Ernawati S.10.17509/invotec.v10i2.4854   Abstract views: 489       PDF downloads: 245    
Era modern membuktikan bahwa antara Perguruan Tinggi (PT) dengan perusahaan terdapat banyak kesamaan, antara lain sama-sama memiliki pelanggan, memroses dan menghasilkan produk/jasa, mengelola SDM, keuangan, dan pelanggan. Berdasarkan kesamaan yang ada P... ver más
Revista: Invotec

 
Sutedjo Sutedjo,Afifuddin Rizqi,Endro Wahjono     Pág. 67 - 80
Sebagai sumber energi terbarukan fotovoltaik berkembang pesat. Fotovoltaik memiliki karakteristik arus dan tegangan non-linier, memiliki nilai daya maksimum pada tegangan optimal, dan bergantung pada kondisi lingkungan seperti suhu dan radiasi. Jadi ada ... ver más

 
Ginanjar Wiro Sasmito     Pág. 119 - 123
Pemanfaatan E-Academic dengan teknologinya saat ini belum selaras dengan kebutuhan Politeknik Harapan Bersama yang sebenarnya, sehingga memungkinkan penerapan e-academic tersebut saling tumpang tindih. Kebutuhan pada Politeknik Harapan Bersama tersebut h... ver más

 
Herry Pintardi Chandra     Pág. pp. 16 - 23
Factors in building system design have target in achieving maximum performance when they have proper correlation with total performance and building integrity. The purpose of this research is to find out the influence of building system: structural, enve... ver más