Analisis Sentimen Pemilu 2019 pada Berita Online: Menggali Persepsi Publik dengan Logistic Regression

Informatika.umsida.ac.id – Pemilu 2019 di Indonesia menjadi topik hangat yang memicu banyak perbincangan, terutama di media online. Melalui berbagai portal berita online, publik mengekspresikan pandangan mereka tentang jalannya pemilu, pasangan calon, dan isu-isu seputar integritas proses pemilihan. Untuk memahami bagaimana persepsi publik terhadap Pemilu 2019, penelitian terbaru dari Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sidoarjo, memanfaatkan analisis sentimen dengan metode Logistic Regression.

Pentingnya Analisis Sentimen dalam Pemilu 2019

Pemilihan umum selalu menjadi momen penting bagi negara demokratis seperti Indonesia. Pada Pemilu 2019, perhatian publik meningkat tajam, terutama melalui platform berita online yang melaporkan berbagai perkembangan. Penelitian ini bertujuan untuk menggali lebih dalam bagaimana masyarakat bereaksi terhadap Pemilu 2019 berdasarkan judul-judul berita yang tersebar di berbagai portal berita online. Melalui analisis sentimen, peneliti mengkategorikan reaksi publik ke dalam tiga kelas: positif, netral, dan negatif.

Dengan menggunakan 395 judul berita sebagai data penelitian, proses klasifikasi ini memberikan gambaran tentang bagaimana masyarakat bereaksi terhadap berbagai peristiwa dan isu terkait Pemilu 2019. Metode yang digunakan dalam penelitian ini adalah Logistic Regression, yang terbukti mampu mengklasifikasikan data dengan akurasi yang tinggi, mencapai 86%.

Tahapan Preprocessing dalam Analisis Sentimen

Proses analisis sentimen dimulai dengan tahapan preprocessing, yang penting untuk memastikan data siap diolah. Data dalam bentuk teks, seperti judul berita, umumnya tidak terstruktur. Oleh karena itu, perlu dilakukan beberapa langkah untuk menyiapkan data tersebut agar lebih mudah dianalisis.

Tahapan preprocessing mencakup beberapa langkah utama:

  • Case Folding: Mengonversi semua huruf dalam teks menjadi huruf kecil. Ini dilakukan untuk memastikan bahwa perbedaan kapitalisasi tidak memengaruhi analisis.
  • Remove Punctuation: Tanda baca dihilangkan karena tidak memberikan nilai informatif bagi analisis sentimen.
  • Stemming: Mengubah kata-kata ke dalam bentuk dasar dengan menghilangkan imbuhan, seperti awalan dan akhiran.
  • Pembobotan Kata: Pada tahap ini, metode Term Frequency-Inverse Document Frequency (TF-IDF) digunakan untuk mengukur seberapa penting suatu kata dalam dokumen.

Langkah-langkah tersebut membantu mengubah teks yang awalnya tidak terstruktur menjadi lebih siap untuk diolah dalam model machine learning.

Penerapan Logistic Regression untuk Klasifikasi Sentimen

Setelah melalui tahapan preprocessing, data diolah menggunakan Logistic Regression. Logistic Regression merupakan salah satu metode klasifikasi yang sering digunakan dalam analisis sentimen. Dalam penelitian ini, metode ini diterapkan untuk membagi judul berita ke dalam tiga kategori sentimen: positif, netral, dan negatif.

Data awal menunjukkan ketidakseimbangan dalam jumlah data untuk setiap kelas sentimen. Sebagai contoh, ada 215 judul berita yang termasuk dalam sentimen positif, sedangkan judul berita dengan sentimen negatif hanya berjumlah 85. Untuk menangani ketidakseimbangan data ini, peneliti menerapkan teknik oversampling dengan menggunakan Synthetic Minority Over-sampling Technique (SMOTE). Teknik ini membantu meningkatkan representasi data minoritas, seperti sentimen negatif dan netral, sehingga hasil analisis lebih akurat.

Setelah data seimbang, Logistic Regression digunakan untuk memprediksi sentimen dari data uji. Hasilnya menunjukkan tingkat akurasi yang tinggi, dengan skor uji sebesar 86%, yang mencerminkan kemampuan model untuk mengklasifikasikan judul berita secara efektif.

Hasil dan Evaluasi: Akurasi Tinggi untuk Prediksi Sentimen

Hasil akhir dari penelitian ini menunjukkan bahwa Logistic Regression mampu memberikan prediksi yang cukup akurat terhadap sentimen yang terkandung dalam judul berita. Akurasi keseluruhan dari model ini mencapai 86%, yang mencerminkan bahwa metode ini efektif dalam memprediksi apakah suatu judul berita memiliki sentimen positif, netral, atau negatif.

Untuk memastikan kualitas model, evaluasi dilakukan menggunakan Confusion Matrix. Melalui evaluasi ini, peneliti dapat mengukur performa model dengan melihat seberapa banyak prediksi yang benar (True Positive dan True Negative) serta prediksi yang salah (False Positive dan False Negative).

Meski hasilnya memuaskan, penelitian ini juga menemukan bahwa model Logistic Regression yang digunakan masih menunjukkan adanya overfitting. Ini terlihat dari perbedaan yang cukup signifikan antara skor data latih dan data uji, dengan selisih sebesar 12%. Peneliti menyarankan bahwa di masa depan, perlu dilakukan perbaikan pada tahapan preprocessing dan pengujian metode machine learning lainnya untuk mengatasi masalah ini.

Penelitian ini memberikan wawasan yang menarik tentang bagaimana publik bereaksi terhadap Pemilu 2019 berdasarkan judul-judul berita online. Dengan menggunakan metode Logistic Regression, peneliti berhasil mengklasifikasikan judul berita ke dalam tiga kategori sentimen: positif, netral, dan negatif, dengan tingkat akurasi yang mencapai 86%. Meskipun hasilnya cukup baik, penelitian ini menunjukkan bahwa masih ada ruang untuk perbaikan, khususnya dalam mengatasi masalah overfitting dan mencoba metode machine learning lainnya di masa depan.

Analisis sentimen seperti ini dapat menjadi alat yang berguna bagi para peneliti dan pengamat politik untuk memahami bagaimana pandangan masyarakat berkembang seiring dengan berbagai peristiwa penting di tanah air.

Sumber: Freepik, Jurnal

Penulis: Ifa

Bertita Terkini

Digitalisasi Pembukuan sebagai Solusi untuk UMKM Sidoarjo
January 21, 2025By
E-Modul Berbasis Al-Islam Kemuhammadiyahan: Solusi Pendidikan Nilai di Era Digital
January 19, 2025By
Kritik terhadap Pembelajaran Hybrid: Perlunya Pendekatan Alternatif dalam Pendidikan Tinggi
January 11, 2025By
Optimalisasi Layanan Pelanggan dengan Sistem Informasi Penyewaan Mobil Berbasis Web
January 5, 2025By
Efektivitas Media Edutainment dalam Pembelajaran Matematika Selama Pandemi
December 30, 2024By
Inovasi Baru: Aplikasi Android Mahkota Motor untuk Solusi Perawatan Kendaraan
December 28, 2024By
Deteksi Masker Wajah: Solusi Modern untuk Kesehatan dan Keselamatan
December 23, 2024By
Mengelola Risiko Bisnis di Industri Pembangkit Listrik Pasca-Pandemi
December 22, 2024By

Prestasi

M. Nauval Amrullah dari Prodi Informatika UMSIDA Raih Gelar Juara di Bandung Lautan Api 4 2023 Internasional Championship
February 29, 2024By
IPSI Banyuwangi Championship: Havi Ihsan Fadillah dari Prodi Informatika UMSIDA Raih Kemenangan di Kelas D Putra Tingkat Dewasa
February 29, 2024By
Lulus 3,5 Tahun, Mahasiswa Informatika Raih IPK Tertinggi Se-Fakultas Saintek
May 8, 2023By
Mahasiswa Informatika menjadi Juara II pada Lomba Eksplorasi Wisata Nusantara Tingkat Nasional
September 20, 2021By
Mahasiswa Umsida Lolos Seleksi Program Bangkit-Kampus Merdeka
February 2, 2021By