Perbandingan Performa Random Forest dan Long Short-Term Memory dalam Klasifikasi Teks Multilabel Terjemahan Hadits Bukhari

Comparison of Random Forest and Long Short-Term Memory Performance in Multilabel Text Classification of Bukhari Hadith Translation

Authors

  • Rizmah Zakiah Nur Ahmad Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Nazruddin Safaat Harahap Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Surya Agustian Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Iwan Iskandar Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Suwanto Sanjaya Universitas Islam Negeri Sultan Syarif Kasim Riau

DOI:

https://doi.org/10.57152/malcom.v5i3.2046

Keywords:

Hadits Bukhari, Hamming Loss, Klasifikasi Teks, Long Short-Term Memory, Random Forest

Abstract

Hadits merupakan fondasi utama kedua dalam Islam, yang memandu umat Islam dalam menafsirkan nilai-nilai Islam dan mengimplementasikannya secara nyata dalam berbagai aspek kehidupan. Salah satu perawi hadits yang paling dihormati adalah Imam Bukhari, yang dikenal dengan ketelitian dan ketegasannya dalam memilih hadits-hadits yang otentik. Penelitian ini menggunakan data dari terjemahan hadis dari Sahih Bukhari ke dalam bahasa Indonesia yang telah diklasifikasikan ke dalam tiga kategori utama, yaitu anjuran, larangan, dan informasi. Untuk mengidentifikasi karakteristik masing-masing kategori, klasifikasi teks dilakukan dengan menggunakan dua metode populer, yaitu Random Forest (RF) dan Long Short-Term Memory (LSTM), yang dikenal efektif dalam memproses data teks berskala besar dan kompleks. Tujuan dari penelitian ini adalah untuk menguji perbedaan kinerja antara kedua metode tersebut dalam mengelompokkan hadis yang datanya telah lengkap. Hasil evaluasi menunjukkan bahwa metode RF mencapai akurasi tertinggi sebesar 89,48%, sedikit lebih unggul dari LSTM yang memperoleh 88,52%. Kedua metode mencatat nilai Hamming Loss yang sama, yaitu 0,1048 (89,52%). Temuan ini menunjukkan bahwa kelengkapan dan kualitas data hadis Bukhari berkontribusi dalam meningkatkan akurasi klasifikasi dengan memberikan konteks dan variasi yang lebih baik untuk model.

Downloads

Download data is not yet available.

References

M. A. H. Muhammad, M. I. Afkarina, S. S. Shalsabila, and S. Fikri, “Hadist Ditinjau Dari Kualitas Sanad Dan Matan (Hadist Shohih, Hasan, Dhoif),” Jurnal Kajian Islam dan Sosial Keagamaan, vol. 1, no. 4, pp. 396–401, 2024, Accessed: Jun. 03, 2025. [Online]. Available: https://jurnal.ittc.web.id/index.php/jkis/article/view/1103

R. Kustiawan, A. Adiwijaya, and M. D. Purbolaksono, “A Multi-label Classification on Topic of Hadith Verses in Indonesian Translation using CART and Bagging,” Jurnal Media Informatika Budidarma, vol. 6, no. 2, pp. 868–875, Apr. 2022, doi: 10.30865/mib.v6i2.3787.

H. M. Evan, “Analisis Deskriptif Kitab Shahih Al-Bukhari,” JIQTA: Jurnal Ilmu Al-Qur’an dan Tafsir, vol. 1, no. 1, pp. 19–34, 2022, doi: https://doi.org/10.36769/jiqta.v1i1.187.

R. S. Mutaqin, Z. Nurpadilah, and H. Z. Muttaqin, “Perawi Mudallis dalam Shahih Bukhari: Studi al-Jarh wa al-Ta’dil pada ’Umar bin ’Ali bin ‘Atha’ bin Muqaddam,” Riwayah?: Jurnal Studi Hadis, vol. 7, no. 2, pp. 241–272, Dec. 2021, doi: 10.21043/riwayah.v7i2.10651.

N. Fatiara, N. H. Safaat, S. Agustian, and I. Afrianty, “Komparasi Metode K-Nearest Neighbors Dan Long Short Term Memory,” ZONASI: Jurnal Sistem Informasi, vol. 6, no. 2, pp. 332–345, 2024.

M. Y. A. Bakar and Adiwijaya, “Klasifikasi Teks Hadis Bukhari Terjemahan Indonesia Menggunakan Recurrent Convolutional Neural Network (CRNN),” Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), vol. 8, no. 5, pp. 907–918, 2021, doi: 10.25126/jtiik.202183750.

D. C. Hidayati, S. Al Faraby, and A. Adiwijaya, “Klasifikasi Topik Multi Label pada Hadis Shahih Bukhari Menggunakan K-Nearest Neighbor dan Latent Semantic Analysis,” JURIKOM (Jurnal Riset Komputer), vol. 7, no. 1, p. 140, Feb. 2020, doi: 10.30865/jurikom.v7i1.2013.

F. Diba, M. S. Lydia, and P. Sihombing, “Analisis Random Forest Menggunakan Principal Component Analysis Pada Data Berdimensi Tinggi,” Indonesian Journal of Computer Science, vol. 12, no. 4, pp. 2152–2160, 2023, doi: https://doi.org/10.33022/ijcs.v12i4.3329.

D. P. Aftari, N. H. Safaat, S. Agustian, and I. Afrianty, “Perbandingan Performa Klasifikasi Terjemahan Al-Qur’an Menggunakan Metode Random Forest dan Long Short Term Memory,” Journal of Computer System and Informatics (JoSYC), vol. 5, no. 3, pp. 567–577, 2024, doi: 10.47065/josyc.v5i3.5156.

S. Ningsih et al., “Pengaruh Penyeimbangan Data Pada Klasifikasi Terjemahan Al-Quran Dengan Metode Naïve Bayes dan Long Short Term Memory,” Journal of Computer System and Informatics (JoSYC), vol. 5, no. 3, pp. 626–635, 2024, doi: 10.47065/josyc.v5i3.5181.

P. Pangestu, R. Novita, S. Informasi, and U. Sultan Syarif Kasim Riau, “Systematic Literature Review: Perbandingan Algoritma Klasifikasi,” Jurnal Inovtek Polbeng - Seri Informatika, vol. 8, no. 2, pp. 431–440, 2023, doi: https://doi.org/10.35314/isi.v8i2.3698.

G. A. B. Suryanegara, Adiwijaya, and M. D. Purbolaksono, “Peningkatan Hasil Klasifikasi pada Algoritma Random Forest untuk Deteksi Pasien Penderita Diabetes Menggunakan Metode Normalisasi,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 114–122, Feb. 2021, doi: 10.29207/resti.v5i1.2880.

H. N. Harish, S. Al Faraby, and M. Dwifebri, “Klasifikasi Multi Label Pada Hadis Bukhari Terjemahan Bahasa Indonesia menggunakan Random Forest, Mutual Information, dan Chi-Square,” in e-Proceeding of Engineering, 2021, pp. 10583–10593. Accessed: Jun. 03, 2025. [Online]. Available: https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/view/15675

Y. Karaman, F. Akdeniz, B. K. Sava?, and Y. Becerikli, “A Comparative Analysis of SVM, LSTM and CNN-RNN Models for the BBC News Classification,” in Lecture Notes in Networks and Systems, Springer Science and Business Media Deutschland GmbH, 2023, pp. 473–483. doi: 10.1007/978-3-031-26852-6_44.

R. A. Pramunendar, D. P. Prabowo, and R. A. Megantara, “Metode Recurrent Neural Network (Rnn) Dengan Arsitektur Lstm Untuk Analisis Sentimen Opini Publik Terkait Vaksin Covid-19,” JURNAL INFORMATIKA UPGRIS, vol. 8, no. 1, pp. 42–45, 2022.

G. Budiprasetyo, M. Hani’ah, and D. Z. Aflah, “Prediksi Harga Saham Syariah Menggunakan Algoritma Long Short-Term Memory (LSTM),” Jurnal Nasional Teknologi dan Sistem Informasi, vol. 8, no. 3, pp. 164–172, Jan. 2023, doi: 10.25077/teknosi.v8i3.2022.164-172.

R. Saputra, N. S. Harahap, Novriyanto, and M. Affandes, “Penerapan Merger Rtriever Pada Question Answering System Hadits,” SATIN - Sains dan Teknologi Informasi, vol. 10, no. 1, pp. 24–35, 2024, doi: https://doi.org/10.33372/stn.v10i1.1117.

T. Wongvorachan, S. He, and O. Bulut, “A Comparison of Undersampling, Oversampling, and SMOTE Methods for Dealing with Imbalanced Classification in Educational Data Mining,” Information (Switzerland), vol. 14, no. 1, pp. 1–15, Jan. 2023, doi: 10.3390/info14010054.

S. Diantika, H. Nalatissifa, N. Maulidah, R. Supriyadi, and A. Fauzi, “Penerapan Teknik Random Oversampling Untuk Memprediksi Ketepatan Waktu Lulus Menggunakan Algoritma Random Forest,” Computer Science (CO-SCIENCE, vol. 4, no. 1, pp. 11–18, 2024, doi: https://doi.org/10.31294/coscience.v4i1.1996.

L. Efrizoni, S. Defit, M. Tajuddin, and A. Anggrawan, “Komparasi Ekstraksi Fitur dalam Klasifikasi Teks Multilabel Menggunakan Algoritma Machine Learning,” MATRIK?: Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer, vol. 21, no. 3, pp. 653–666, Jul. 2022, doi: 10.30812/matrik.v21i3.1851.

R. A. Mu’allim and K. M. Lhaksmana, “Klasifikasi Multi-Label Ayat-Ayat Al-Qur’an Menggunakan Random Forest dan Word Centrality,” Jurnal Penelitian Informatika, vol. 2, no. 2, pp. 9–14, 2024, doi: 10.25124/logic.v2i1.8808.

M. F. Afianto, Adiwijaya, and S. Al Faraby, “Kategorisasi Teks pada Hadits Sahih Al-Bukhari menggunakan Random Forest Text Categorization on Hadith Sahih Al-Bukhari using Random Forest,” in e-Proceeding of Engineering, 2017, pp. 4874–4881. Accessed: Jun. 03, 2025. [Online]. Available: https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/view/5416

Y. Romadhoni, K. Fahmi, and H. Holle, “Analisis Sentimen Terhadap PERMENDIKBUD No.30 pada Media Sosial Twitter Menggunakan Metode Naive Bayes dan LSTM,” Jurnal Informatika: Jurnal pengembangan IT (JPIT), vol. 7, no. 2, pp. 118–124, 2022, doi: https://doi.org/10.30591/jpit.v7i2.3191.

I. Akbar, M. Faisal, and T. Chamidy, “Multi-label classification of Indonesian qur’an translation using long short-term memory model,” Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control, vol. 9, no. 2, pp. 119–128, 2024, doi: https://doi.org/10.22219/kinetik.v9i2.1901.

M. R. Athallah and K. M. Lhaksmana, “Hadith Text Classification Based on Topic Using Convolutional Neural Network (CNN) and TF-IDF,” Journal of Renewable Energy, Electrical, and Computer Engineering, vol. 5, no. 1, pp. 30–36, Mar. 2025, doi: 10.29103/jreece.v5i1.20354.

Downloads

Published

2025-06-19

How to Cite

Ahmad, R. Z. N., Harahap, N. S., Agustian, S., Iskandar, I., & Sanjaya, S. (2025). Perbandingan Performa Random Forest dan Long Short-Term Memory dalam Klasifikasi Teks Multilabel Terjemahan Hadits Bukhari: Comparison of Random Forest and Long Short-Term Memory Performance in Multilabel Text Classification of Bukhari Hadith Translation. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 5(3), 862-874. https://doi.org/10.57152/malcom.v5i3.2046