Implementasi TF-IDF dan Cosine Similarity untuk Penyaringan Dokumen Berita Program Makan Siang Gratis Pemerintah Indonesia

William Tanuwijaya, Christofer Evan Setiawan, Hafiz Irsyad, Abdul Rahman

Abstract


Penelitian ini menerapkan metode Information Retrieval (IR) dalam menyaring berita yang relevan terkait program makan siang gratis yang diselenggarakan oleh pemerintah Indonesia, sebuah program yang ditujukan untuk meningkatkan gizi pelajar dan mencegah terjadinya stunting, namun juga menampilkan data berita dari berbagai media nasional, preprocessing data (termasuk case folding, tokenisasi, stopword removal dan stemming), pembobotan kata menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF), serta menggunakan pengukuran tingkat relevansi menggunakan Cosine Similarity. Dataset terdiri dari lima berita dengan topik terkait, yang IR mampu menyaring dokumen secara efektif. Dari lima Berita, empat di antaranya terdeteksi relevan dan satu tidak relevan. Evaluasi model menghasilkan akurasi sebesar 80%, precision 100%, recall 80% dan f1-score 89%. Nilai-nilai ini menunjukkan bahwa sistem dapat mengidentifikasi relevansi konten Berita terhadap topik yang terutama dalam kasus judul Berita yang bersifat clickbait. Penelitian ini juga memberikan kontribusi terhadap pengembangan sistem penyaringan informasi yang lebih efisien dan akurat dalam konteks isu publik.



Keywords


Cosine Similarity, Information Retrieval, Penyaringan Berita, Text Mining, TF-IDF.

Full Text:

PDF

References


D. C. Imelda Dwi Putri Nainggolan, “Analisis Framing Portal Berita Kompas.Com dan Mediaindonesia.Com atas Pemberitaan Program Makan Siang Gratis oleh Paslon 02 (Prabowo-Gibran) Pada Periode 28 November 2023 - 10 Februari 2024,” vol. 6, pp. 2266–2282, 2024, doi: 10.47476/reslaj.v6i10.3038.

N. D. S. Muhammad Irfan Luthfi, “Pengembangan Mesin Tanya Jawab Artikel Ilmiah Berbahasa Indonesia,” no. September, 2024.

A. Muhammad, R. Haz, A. N. Rohman, S. Informasi, F. I. Komputer, and U. A. Yogyakarta, “SISTEM REKOMENDASI BERITA DENGAN METODE,” vol. 9, no. 2, pp. 143–150, 2025.

B. D. R. Dwi Remawati, Hendro Wijayanto, Yustina Retno Wahyu Utami, “Pengelompokkan Film Trending di Youtube Menggunakan TF-IDF dan,” vol. 4, pp. 65–74, 2025.

A. Muhammad, R. Haz, A. N. Rohman, S. Informasi, F. I. Komputer, and U. A. Yogyakarta, “SISTEM REKOMENDASI BERITA DENGAN METODE,” vol. 9, no. 2, pp. 143–150, 2025.

E. P. Bangun, F. V. I. A Koagouw, and J. S. Kalangi, “Analisis Isi Unsur Kelengkapan Berita Pada Media Online Manadopostonline.com,” Acta Diurna Komun., vol. 1, no. 3, pp. 4–13, 2019, [Online]. Available: https://ejournal.unsrat.ac.id/index.php/actadiurnakomunikasi/article/view/25560

S. A. Putri, Y. Winoto, and R. Rohanda, “Pemetaan penelitian information retrieval system menggunakan VOSviewer,” Informatio J. Libr. Inf. Sci., vol. 3, no. 2, p. 93, 2023, doi: 10.24198/inf.v3i2.46646.

N. Silalahi and Guidio Leonarde Ginting, “Rekomendasi Berita Berkaitan dengan Menerapkan Algoritma Text Mining dan TF-IDF,” Bull. Comput. Sci. Res., vol. 3, no. 4, pp. 276–282, 2023, doi: 10.47065/bulletincsr.v3i4.266.

D. Andreswari, D. Suranti, and D. A. Trianggara, “Application Of Text Mining In Grouping Thesis Topics Using TF-IDF Method Based On Thesis Abstract Penerapan Text Mining Dalam Pengelompokkan Topik Skripsi Menggunakan Metode TF-IDF Berdasarkan Abstrak Skripsi,” vol. 3, no. 2, pp. 69–78, 2024.

A. PUTRI, “Sistem Rekomendasi Skincare Dengan Metode Keyword Extraction Dan Cosine Similarity,” Repository.Unissula.Ac.Id, vol. 13, no. 1, pp. 104–116, 2023.

Z. Alhaq and J. D. S. , Ali Mustopa , Sri Mulyatun, “PENERAPAN METODE SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN PENGGUNA TWITTER,” Media Inform., vol. 20, no. 2, pp. 97–108, 2021, doi: 10.37595/mediainfo.v20i2.59.

S. M. Fani, R. Santoso, and S. Suparti, “Penerapan Text Mining Untuk Melakukan Clustering Data Tweet Akun Blibli Pada Media Sosial Twitter Menggunakan K-Means Clustering,” J. Gaussian, vol. 10, no. 4, pp. 583–593, 2021, doi: 10.14710/j.gauss.v10i4.30409.




DOI: https://doi.org/10.46576/device.v6i2.6724

Article Metrics

Abstract view : 0 times
PDF – 0 times

Refbacks

  • There are currently no refbacks.


Copyright (c) 2025 Christofer Evan Setiawan

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

DEVICE : JOURNAL OF INFORMATION SYSTEM, COMPUTER SCIENCE AND INFORMATION TECHNOLOGY
Terindeks pada:

   

Member Of :


DEVICE : JOURNAL OF INFORMATION SYSTEM, COMPUTER SCIENCE AND INFORMATION TECHNOLOGY

Published by :
FAKULTAS TEKNIK DAN ILMU KOMPUTER
PROGRAM STUDI SISTEM INFORMASI
UNIVERSITAS DHARMAWANGSA

Alamat : Jl. K. L. Yos Sudarso No. 224 Medan
Kontak : Tel. 061 6635682 - 6613783  Fax. 061 6615190
E-mail  : admin_device@dharmawangsa.ac.id

 Creative Commons License

Device : Journal Of Information System, Computer Science And Information Technology by Universitas Dharmawangsa is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Based on a work at http://jurnal.dharmawangsa.ac.id/index.php/device