PEMODELAN TOPIK BERITA NASIONAL INDONESIA MENGGUNAKAN LATENT DIRICHLET ALLOCATION
DOI:
https://doi.org/10.31949/infotech.v12i1.16926Abstract
Penelitian ini membahas penerapan metode Latent Dirichlet Allocation (LDA) untuk pemodelan topik berita terkini di Indonesia. Data dikumpulkan melalui RSS feed dari beberapa portal berita nasional seperti Detik, Kompas, Tribunnews, Liputan6, Tempo, CNN Indonesia, dan Antara News. Proses penelitian meliputi tahapan pengambilan data, pembersihan dan preprocessing teks, eksplorasi awal frekuensi kata, penyusunan representasi korpus, pemodelan topik LDA, visualisasi interaktif dengan pyLDAvis, serta evaluasi model menggunakan metrik coherence score. Hasil analisis menunjukkan model LDA dengan lima topik memberikan distribusi kata kunci yang relevan dengan isu-isu utama seperti bencana, politik, demonstrasi, korupsi, dan kriminal. Nilai coherence score sebesar 0,3591 mengindikasikan tingkat koherensi cukup baik, meskipun terdapat ruang optimasi melalui penyesuaian parameter. Visualisasi interaktif menunjukkan keterpisahan topik yang memadai, dengan tumpang tindih yang relatif kecil. Temuan ini memperlihatkan bahwa LDA efektif untuk mengidentifikasi topik dominan dalam berita nasional, sehingga dapat dimanfaatkan untuk analisis tren isu publik, pengelompokan konten media, serta mendukung pengambilan keputusan berbasis data.
Keywords:
topic modeling, LDA, berita indonesia, coherence score, NLPDownloads
References
Albalawi, R., Yeap, T. H., & Benyoucef, M. (2020). Using topic modeling methods for short-text data: A comparative analysis. Frontiers in Artificial Intelligence, 3, 42.
Bakhtiar, N. Y., & Bima, M. R. (2020). Pemenuhan Hak Kebebasan Berpendapat Berdasarkan Undang-undang Nomor 9 Tahun 1999 Tentang Kemerdekaan Berpendapat Di Muka Umum. Journal of Lex Theory (JLT), 1(1), 41–58.
Bamasputri, R. A., Fitriani, I., Salsabila, A. A., & Prasetyaningsih, N. I. D. (2025). TRANSFORMASI DIGITAL: EVOLUSI KOMUNIKASI MASSA DI ERA MEDIA SOSIAL DAN DAMPAKNYA PADA PERILAKU KONSUMSI INFORMASI MASYARAKAT. Didaktik: Jurnal Ilmiah PGSD STKIP Subang, 11(02), 270–286.
Dieng, A. B., Ruiz, F. J. R., & Blei, D. M. (2020). Topic modeling in embedding spaces. Transactions of the Association for Computational Linguistics, 8, 439–453.
Efendi, N. M., Muhammad Ryan Adam Saputra, Srikandi, D., Girsang, S., Rizky Maulana Dzuhry, & Mohamad Andi Budiono. (2025). IMPLEMENTASI ALGORITMA NAÏVE BAYES PADA SENTIMEN PUBLIK TERHADAP SOLUSI MENGHADAPI RESESI DI INDONESIA. INFOTECH Journal, 11(2), 451–457. https://doi.org/10.31949/infotech.v11i2.16723
Farkhod, A., Abdusalomov, A., Makhmudov, F., & Cho, Y. I. (2021). LDA-based topic modeling sentiment analysis using topic/document/sentence (TDS) model. Applied Sciences, 11(23), 11091.
Hosseiny Marani, A., & Baumer, E. P. S. (2023). A review of stability in topic modeling: Metrics for assessing and techniques for improving stability. ACM Computing Surveys, 56(5), 1–32.
Khairani, U., Mutiawani, V., & Ahmadian, H. (2024). Pengaruh Tahapan Preprocessing Terhadap Model Indobert Dan Indobertweet Untuk Mendeteksi Emosi Pada Komentar Akun Berita Instagram. Jurnal Teknologi Informasi Dan Ilmu Komputer, 11(4), 887–894. https://doi.org/10.25126/jtiik.1148315
Kherwa, P., & Bansal, P. (2020). Topic modeling: a comprehensive review. EAI Endorsed Trans. Scalable Inf. Syst., 7(24), e2.
Marzuqi, F., Purba, Y., Syaputra, T., Bismi, W., Kurniawati, I., & Fahlapi, R. (2025). PERBANDINGAN ALGORITMA MACHINE LEARNING UNTUK SENTIMEN ULASAN APLIKASI JOBSTREET. INFOTECH Journal, 11(2), 416–423. https://doi.org/10.31949/infotech.v11i2.16609
Nugroho, D. C., Agustina, A. D., Maulana, B., Darussalam, F., Asyraf, M., & Lubis, B. O. (2025). PENERAPAN METODE SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN PUBLIK PADA PROGRAM MAKAN BERGIZI GRATIS. INFOTECH Journal, 11(2), 474–479. https://doi.org/10.31949/infotech.v11i2.16781
Rakhmawati, N. A., Cisatra, A., Ansori, D. D. M., Akmal, D. N. F. A., & Ramadhani, S. (2024). Identifikasi Topik Hangat di Media Berita Menggunakan Latent Dirichlet Allocation. JIEET (Journal of Information Engineering and Educational Technology), 8(1), 14–17.
Ramadhani, T. Z., Setiawan, N. Y., & Rahayudi, B. (2025). Evaluasi Aplikasi Layanan Alfagift Berdasarkan Topik Ulasan Pengguna Menggunakan Latent Dirichled Allocation (LDA). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 9(6).
Saputra, H. T., Damanik, A., Shaquille, M. M., Rusydi, M. A., Riziq, M. H., & Zulva, N. S. (2025). Analisis Modelling Pada Reviewes Lazada Indonesia Menggunakan Latent Dirichlet Allocation (LDA) Untuk Optimalisasi Strategi Bisnis. JEKIN-Jurnal Teknik Informatika, 5(1), 361–371.
Saputra, M., & Sri Wahyuni. (2024). ANALISIS SENTIMEN PENGGUNA PADA APLIKASI BANK DIGITAL KROM DENGAN ALGORITMA SUPPORT VECTOR MACHINE. INFOTECH Journal, 10(2), 327–332. https://doi.org/10.31949/infotech.v10i2.11801
Sari, T. A., Sinduningrum, E., & Hasan, F. N. (2023). Analisis Sentimen Ulasan Pelanggan Pada Aplikasi Fore Coffee Menggunakan Metode Naïve Bayes. KLIK Kaji. Ilm. Inform. Dan Komput, 3(6), 773–779.
Slamet, R., Gata, W., Novtariany, A., Hilyati, K., & Jariyah, F. A. (2022). Analisis sentimen Twitter terhadap penggunaan artis Korea Selatan sebagai brand ambassador produk kecantikan lokal. INTECOMS J. Inf. Technol. Comput. Sci, 5(1), 145–153.
Suardi, S. (2025). MENINGKATKAN KREDIBILITAS MEDIA DI INDONESIA DALAM ERA DISRUPSI INFORMASI: STRATEGI MENGHADAPI MISINFORMASI DIGITAL. Jurnal Ilmu Komunikasi UHO: Jurnal Penelitian Kajian Ilmu Komunikasi Dan Informasi, 10(1), 249–258.
Suhaeni, C., Mualifah, L. N. A., & Wijayanto, H. (2025). LDA Topic Modeling Analysis of Public Discourse on Indonesia’s Free Nutritious Meals Program (MBG). IJID (International Journal on Informatics for Development), 14(1), 587–600.
Wahyuni, W., Lestari, T. P., Apriliana, M., & Gumelta, R. (2025). Implementation of BERTopic for Topic Modeling Analysis of the Free Nutritious Meal Program Based on YouTube Comments. Journal of Applied Informatics and Computing, 9(4), 1964–1971.
Yu, D., & Xiang, B. (2023). Discovering topics and trends in the field of Artificial Intelligence: Using LDA topic modeling. Expert Systems with Applications, 225, 120114. https://doi.org/10.1016/j.eswa.2023.120114
Zahra, F., Mustaqimmah, N., & Hendra, M. D. (2020). Kekuatan Media Digital Pada Pembentukan Budaya Populer (Studi Pada Komunitas Moarmy Pekanbaru). Komunikasiana: Journal of Communication Studies, 2(2), 109–122.
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Fajar Maula Hidayat, Cahyadi, Hafidz Sanjaya, Dwi Purnomo, Heri Wiranto

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.





