Analisis Sentimen Pemilu 2019 pada Berita Online: Menggali Persepsi Publik dengan Logistic Regression

Informatika.umsida.ac.id – Pemilu 2019 di Indonesia menjadi topik hangat yang memicu banyak perbincangan, terutama di media online. Melalui berbagai portal berita online, publik mengekspresikan pandangan mereka tentang jalannya pemilu, pasangan calon, dan isu-isu seputar integritas proses pemilihan. Untuk memahami bagaimana persepsi publik terhadap Pemilu 2019, penelitian terbaru dari Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sidoarjo, memanfaatkan analisis sentimen dengan metode Logistic Regression.

Pentingnya Analisis Sentimen dalam Pemilu 2019

Pemilihan umum selalu menjadi momen penting bagi negara demokratis seperti Indonesia. Pada Pemilu 2019, perhatian publik meningkat tajam, terutama melalui platform berita online yang melaporkan berbagai perkembangan. Penelitian ini bertujuan untuk menggali lebih dalam bagaimana masyarakat bereaksi terhadap Pemilu 2019 berdasarkan judul-judul berita yang tersebar di berbagai portal berita online. Melalui analisis sentimen, peneliti mengkategorikan reaksi publik ke dalam tiga kelas: positif, netral, dan negatif.

Dengan menggunakan 395 judul berita sebagai data penelitian, proses klasifikasi ini memberikan gambaran tentang bagaimana masyarakat bereaksi terhadap berbagai peristiwa dan isu terkait Pemilu 2019. Metode yang digunakan dalam penelitian ini adalah Logistic Regression, yang terbukti mampu mengklasifikasikan data dengan akurasi yang tinggi, mencapai 86%.

Tahapan Preprocessing dalam Analisis Sentimen

Proses analisis sentimen dimulai dengan tahapan preprocessing, yang penting untuk memastikan data siap diolah. Data dalam bentuk teks, seperti judul berita, umumnya tidak terstruktur. Oleh karena itu, perlu dilakukan beberapa langkah untuk menyiapkan data tersebut agar lebih mudah dianalisis.

Tahapan preprocessing mencakup beberapa langkah utama:

  • Case Folding: Mengonversi semua huruf dalam teks menjadi huruf kecil. Ini dilakukan untuk memastikan bahwa perbedaan kapitalisasi tidak memengaruhi analisis.
  • Remove Punctuation: Tanda baca dihilangkan karena tidak memberikan nilai informatif bagi analisis sentimen.
  • Stemming: Mengubah kata-kata ke dalam bentuk dasar dengan menghilangkan imbuhan, seperti awalan dan akhiran.
  • Pembobotan Kata: Pada tahap ini, metode Term Frequency-Inverse Document Frequency (TF-IDF) digunakan untuk mengukur seberapa penting suatu kata dalam dokumen.

Langkah-langkah tersebut membantu mengubah teks yang awalnya tidak terstruktur menjadi lebih siap untuk diolah dalam model machine learning.

Penerapan Logistic Regression untuk Klasifikasi Sentimen

Setelah melalui tahapan preprocessing, data diolah menggunakan Logistic Regression. Logistic Regression merupakan salah satu metode klasifikasi yang sering digunakan dalam analisis sentimen. Dalam penelitian ini, metode ini diterapkan untuk membagi judul berita ke dalam tiga kategori sentimen: positif, netral, dan negatif.

Data awal menunjukkan ketidakseimbangan dalam jumlah data untuk setiap kelas sentimen. Sebagai contoh, ada 215 judul berita yang termasuk dalam sentimen positif, sedangkan judul berita dengan sentimen negatif hanya berjumlah 85. Untuk menangani ketidakseimbangan data ini, peneliti menerapkan teknik oversampling dengan menggunakan Synthetic Minority Over-sampling Technique (SMOTE). Teknik ini membantu meningkatkan representasi data minoritas, seperti sentimen negatif dan netral, sehingga hasil analisis lebih akurat.

Setelah data seimbang, Logistic Regression digunakan untuk memprediksi sentimen dari data uji. Hasilnya menunjukkan tingkat akurasi yang tinggi, dengan skor uji sebesar 86%, yang mencerminkan kemampuan model untuk mengklasifikasikan judul berita secara efektif.

Hasil dan Evaluasi: Akurasi Tinggi untuk Prediksi Sentimen

Hasil akhir dari penelitian ini menunjukkan bahwa Logistic Regression mampu memberikan prediksi yang cukup akurat terhadap sentimen yang terkandung dalam judul berita. Akurasi keseluruhan dari model ini mencapai 86%, yang mencerminkan bahwa metode ini efektif dalam memprediksi apakah suatu judul berita memiliki sentimen positif, netral, atau negatif.

Untuk memastikan kualitas model, evaluasi dilakukan menggunakan Confusion Matrix. Melalui evaluasi ini, peneliti dapat mengukur performa model dengan melihat seberapa banyak prediksi yang benar (True Positive dan True Negative) serta prediksi yang salah (False Positive dan False Negative).

Meski hasilnya memuaskan, penelitian ini juga menemukan bahwa model Logistic Regression yang digunakan masih menunjukkan adanya overfitting. Ini terlihat dari perbedaan yang cukup signifikan antara skor data latih dan data uji, dengan selisih sebesar 12%. Peneliti menyarankan bahwa di masa depan, perlu dilakukan perbaikan pada tahapan preprocessing dan pengujian metode machine learning lainnya untuk mengatasi masalah ini.

Penelitian ini memberikan wawasan yang menarik tentang bagaimana publik bereaksi terhadap Pemilu 2019 berdasarkan judul-judul berita online. Dengan menggunakan metode Logistic Regression, peneliti berhasil mengklasifikasikan judul berita ke dalam tiga kategori sentimen: positif, netral, dan negatif, dengan tingkat akurasi yang mencapai 86%. Meskipun hasilnya cukup baik, penelitian ini menunjukkan bahwa masih ada ruang untuk perbaikan, khususnya dalam mengatasi masalah overfitting dan mencoba metode machine learning lainnya di masa depan.

Analisis sentimen seperti ini dapat menjadi alat yang berguna bagi para peneliti dan pengamat politik untuk memahami bagaimana pandangan masyarakat berkembang seiring dengan berbagai peristiwa penting di tanah air.

Sumber: Freepik, Jurnal

Penulis: Ifa

Bertita Terkini

Digitalisasi Perpustakaan SMA Muhammadiyah 1 Taman: Inovasi melalui Sistem Informasi Teknologi
December 16, 2024By
Aplikasi Pengenalan Virus Covid-19 Berbasis Augmented Reality: Terobosan Baru Edukasi Kesehatan
December 14, 2024By
Teknologi Naïve Bayes untuk Deteksi Dini Gangguan Kecemasan dengan Moodlify
December 9, 2024By
Sistem Pakar Diagnosa Anemia: Inovasi Teknologi untuk Kesehatan Masyarakat
December 2, 2024By
Sistem Pakar Diagnosa Gangguan Kecemasan: Inovasi Teknologi untuk Kesehatan Mental
November 24, 2024By
Sistem Pakar Forward Chaining: Solusi Diagnosa Influenza dan Pilek yang Akurat
November 21, 2024By
Revolusi Pembelajaran Anatomi: Augmented Reality Tingkatkan Pemahaman Siswa di Sekolah Menengah
November 19, 2024By
Achmad Danu Zakaria: Perjalanan Inspiratif Mahasiswa Informatika Umsida yang Berprestasi di Bidang Akademik dan Organisasi
November 11, 2024By

Prestasi

M. Nauval Amrullah dari Prodi Informatika UMSIDA Raih Gelar Juara di Bandung Lautan Api 4 2023 Internasional Championship
February 29, 2024By
IPSI Banyuwangi Championship: Havi Ihsan Fadillah dari Prodi Informatika UMSIDA Raih Kemenangan di Kelas D Putra Tingkat Dewasa
February 29, 2024By
Lulus 3,5 Tahun, Mahasiswa Informatika Raih IPK Tertinggi Se-Fakultas Saintek
May 8, 2023By
Mahasiswa Informatika menjadi Juara II pada Lomba Eksplorasi Wisata Nusantara Tingkat Nasional
September 20, 2021By
Mahasiswa Umsida Lolos Seleksi Program Bangkit-Kampus Merdeka
February 2, 2021By