Cut Raudhatul Ilmi, 210705005 (2025) Pengaruh Tahapan Preprocessing Terhadap Kinerja Model SVM (Support Vector Machine) dan Naive Bayes Untuk Mendeteksi Ujaran Kebencian Pada Komentar Akun Instagram. Other thesis, Universitas Islam Negeri Ar-Raniry Banda Aceh.
Cut Raudhatul Ilmi, 210705005, FST, TI, 082232155390.pdf - Published Version
Available under License Creative Commons Attribution.
Download (8MB)
Cut Raudhatul Ilmi, 210705005, FST, TI.pdf - Published Version
Restricted to Repository staff only
Available under License Creative Commons Attribution.
Download (12MB)
Abstract
Perkembangan media sosial seperti Instagram telah menyebabkan meningkatnya penyebaran ujaran kebencian secara daring. Untuk mengatasi hal ini, diperlukan sistem deteksi otomatis yang akurat. Penelitian ini bertujuan untuk menganalisis pengaruh tahapan preprocessing, khususnya remove stopwords dan stemming, terhadap kinerja model klasifikasi Support Vector Machine (SVM) dan Naïve Bayes dalam mendeteksi ujaran kebencian. Data yang digunakan dikumpulkan dari akun Instagram @kaesangp dan @erinagudono dengan total 5.118 komentar yang telah dilabeli dan divalidasi. Penelitian dilakukan dalam dua alur: alur pertama menggunakan preprocessing lengkap, dan alur kedua tanpa remove stopwords dan stemming. Dataset dibagi menjadi data latih, validasi, dan uji. Evaluasi dilakukan menggunakan confusion matrix dengan metrik akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa pada alur pertama, model SVM memiliki performa terbaik dengan akurasi 0.8498, precision 0.7906, recall 0.6817, dan F1-score 0.7134. Sedangkan model Naïve Bayes memiliki presisi tinggi namun recall rendah. Pada alur kedua, performa SVM sedikit menurun, sedangkan model hybrid (gabungan SVM dan Naïve Bayes) menunjukkan kinerja terbaik dengan akurasi 0.8546, precision 0.8388, recall 0.6577, dan F1-score 0.6948. Temuan ini menunjukkan bahwa tahapan preprocessing sangat memengaruhi kinerja model, serta pendekatan hybrid dapat menjadi solusi efektif dalam klasifikasi ujaran kebencian, terutama ketika preprocessing tidak dilakukan secara optimal.
| Item Type: | Thesis (Other) |
|---|---|
| Subjects: | 000 Computer Science, Information and System > 005 Computer Programming, Program & Data |
| Divisions: | Fakultas Sains dan Teknologi > S1 Teknologi Informasi |
| Depositing User: | Cut Raudhatul Ilmi |
| Date Deposited: | 22 Jul 2025 03:21 |
| Last Modified: | 09 Sep 2025 08:52 |
| URI: | http://repository.ar-raniry.ac.id/id/eprint/46424 |
