https://www.journal.irpi.or.id/index.php/malcom/issue/feedMALCOM: Indonesian Journal of Machine Learning and Computer Science2025-06-19T14:50:47+00:00Mustakimmustakim@irpi.or.idOpen Journal Systems<p><strong>MALCOM: Indonesian Journal of Machine Learning and Computer Science</strong> is a scientific journal published by the Institut Riset dan Publikasi Indonesia (IRPI) in collaboration with several Universities throughout Riau and Indonesia. MALCOM will be published 2 (two) times a year, April and October, each edition containing more than 20 articles articles (Start at Vol. 3 No. 2 October 2023). Articles may be written in Indonesian or English. articles are original research results with a maximum plagiarism of 15%. Articles submitted to MALCOM will be reviewed by at least 2 (two) reviewers. Papers must be submitted via the Open Journal System (OJS) in .doc or .docx format. The entire process until MALCOM is published will be free of charge. MALCOM is registered in National Library with Number International Standard Serial Number (ISSN) Printed: <a href="https://issn.brin.go.id/terbit/detail/20210528410989325" target="_blank" rel="noopener">2797-2313</a> and Online <a href="https://issn.brin.go.id/terbit/detail/1615088206" target="_blank" rel="noopener">2775-8575</a>. </p>https://www.journal.irpi.or.id/index.php/malcom/article/view/1934Smart Prescription Reader: Enhancing Accuracy in Medical Prescriptions 2025-01-26T02:08:57+00:00Ragil Yulianto14240007@nusamandiri.ac.id<p>Reading a doctor's handwritten prescription is a challenge faced by most patients and some pharmacists, which in some cases can lead to negative consequences due to misinterpretation of the prescription. The "Doctor's Handwritten Prescription BD Dataset" on Kaggle contains segmented images of handwritten prescription words from BD (Bangladesh) doctors. This dataset, intended for machine learning applications, includes 4,680 individual words segmented from prescription images. This study introduces a Handwriting Recognition System using Convolutional Neural Network (CNN) developed to identify text in prescription images written by doctors and convert the cursive handwriting into readable text. Two models were evaluated in this study: CNN and MobileNet. Based on the experiments, MobileNet showed better results compared to CNN alone. From the dataset of 4,680 words, 3,120 were used for training, 780 for testing, and 780 for validation. The study achieved a training accuracy of 97%, a testing accuracy of 88%, and a validation accuracy of 83%. The developed model was successfully implemented in a web application</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Ragil Yuliantohttps://www.journal.irpi.or.id/index.php/malcom/article/view/1929Revolutionizing Corporate Event Planning with AI: A Cost-Efficiency Strategy for BuatEvent.id2025-01-26T01:39:43+00:00Muhammad Supriyadi14240020@nusamandiri.ac.idYan Riantoyan.yrt@nusamandiri.ac.id<p>BuatEvent.id leverages an AI-driven platform for event planning, powered by Gemini.ai—a sophisticated NLP model with an accuracy rate of 92.5%. The system integrates multiple technologies, including PHP, Python, Golang, Flutter, and MySQL, to automate essential processes, achieving a 25% improvement in planning precision. This study aims to evaluate the role of AI in enhancing budget management and corporate event customization. By addressing the inefficiencies of conventional event planning, this platform optimizes workflows, enhances overall productivity, and offers a seamless user experience customized to cater to a wide range of client requirements. The results demonstrate a 92.5% accuracy in processing user queries and a 25% increase in event planning efficiency, highlighting the platform’s ability to deliver cost-effective and personalized solutions. These figures were obtained through internal testing using a dataset of 200 annotated user queries. The platform primarily targets corporate events, including workshops, product launches, and business meetings.For example, the system was successfully deployed during a corporate training event in Jakarta, where it reduced planning time by 30%.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Muhammad Supriyadi, Yan Riantohttps://www.journal.irpi.or.id/index.php/malcom/article/view/1931AI-Powered: Leveraging Teachable Machine for Real-time Scanner 2025-01-26T01:50:13+00:00Frizca Fellicita Marcelly14240021@nusamandiri.ac.idYan Riantoyan.yrt@nusamandiri.ac.id<p>Effective inventory control is essential in optimizing profitability through cost control and efficiency expectations. Conventional inventory techniques frequently find it difficult to adjust to the fast-changing restaurant setting, resulting in surplus stock, inventory deficits, and unnecessary food waste. Nonetheless, a notable shift is approaching, as the incorporation of artificial intelligence (AI) may help address this issue. AI-powered inventory management systems help restaurants optimize stock levels, reduce waste, and predict demand more accurately, leading to improved efficiency and increased profitability. This study explores how AI-driven inventory management enhances efficiency, reduces waste, and automates restocking in the restaurant sector, with a particular focus on TastyGo's integration of Teachable Machine and TensorFlow Lite. The suggested solution uses picture recognition for real-time inventory tracking, and machine learning models to predict demand and replenishment automation. TastyGo can expedite supply chain management, save waste through predictive analytics, and improve its inventory by employing these AI techniques. This study shows how AI-driven solutions may boost decision-making, reduce food waste, and greatly increase operational efficiency, all of which can result in higher profitability. The findings highlight how AI technologies have the potential to revolutionize conventional inventory management systems in the restaurant industry.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Frizca Fellicita Marcelly, Yan Riantohttps://www.journal.irpi.or.id/index.php/malcom/article/view/1977Optimization of Customer Segmentation in the Retail Industry Using the K-Medoid Algorithm2025-02-19T07:46:59+00:00Endy Wulan Agustinendywulana@gmail.comKurnia Uthami2210031802070@sar.ac.idArvan Izzatul Ulfa2210031802104@sar.ac.idLusiana Efrizonilusiana@stmik-amik-riau.co.idRahmaddenirahmaddeni@usti.ac.id<p>The retail industry faces significant challenges in understanding increasingly complex customer behavior due to massive data growth. One major obstacle is suboptimal customer segmentation, leading to ineffective marketing strategies. This study aims to optimize customer segmentation by implementing the K-Medoid algorithm, which excels in handling outliers and producing more stable clusters compared to K-Means. The dataset consists of over 10,000 customer transactions from a major retail company in Indonesia. The research process includes data collection and preprocessing, K-Medoid algorithm implementation, and performance evaluation using the silhouette score. The results indicate that the K-Medoid algorithm achieves more accurate customer segmentation, with a silhouette score of 0.39. The generated clusters exhibit greater homogeneity, enabling companies to design more targeted marketing strategies, such as specific discount offers and tailored loyalty programs. Based on these findings, the K-Medoid algorithm is recommended to enhance customer management effectiveness in the retail industry. This study contributes to selecting a more suitable algorithm for customer segmentation in the era of big data and opens opportunities for further exploration of hybrid algorithms and additional evaluation metrics.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Endy Wulan Agustin, Kurnia Uthami, Arvan Izzatul Ulfa, Lusiana Efrizoni, Rahmaddenihttps://www.journal.irpi.or.id/index.php/malcom/article/view/1945Internet of Things Based Air Quality Monitoring System with Automatic Notification2025-02-19T07:37:11+00:00Devi Nur Azizahdevi77078@gmail.comSri Heranurweniheranur@usm.ac.idLa Ode Muhamad Idrislaode@usm.ac.id<p>Internet of Things (IoT)-based air quality monitoring systems represent a significant advancement in urban environmental management. This research implements a system that integrates PM2.5, PM10, CO2, and NO2 sensors for real-time monitoring of pollutants. The results showed that the integration of IoT technology with cloud computing and machine learning algorithms successfully created a responsive and accurate monitoring system. The model achieved maximum accuracy during the training process, with promising predictive capabilities in real-world implementation. The main findings of the study confirmed that the Weighted Class (WC) approach significantly improved performance in the testing and prediction process by addressing class imbalance in the dataset, while the Data Augmentation (DA) technique did not show the expected improvement due to the intrinsic characteristics of air quality data. The automatic notification system successfully provides early warnings when air quality exceeds specified thresholds, enabling proactive responses from authorities and the public. The implementation of a web-based monitoring dashboard provides comprehensive visualization of data for long-term analysis. This research contributes to the development of smart cities by providing an effective framework for air quality management, supporting data-driven decision-making, and increasing public awareness of environmental conditions.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Devi Nur Azizah, Sri Heranurweni, La Ode Muhamad Idrishttps://www.journal.irpi.or.id/index.php/malcom/article/view/1933Real-Time Road Damage Detection on Mobile Devices using TensorFlow Lite and Teachable Machine2025-01-26T02:04:37+00:00Lusindah Novalusindah.ebook@gmail.comYan Riantoyan.yrt@nusamandiri.ac.id<p>This study presents a mobile-based road damage detection system using Teachable Machine and TensorFlow Lite to support real-time monitoring and efficient infrastructure maintenance. The system identifies road damage types such as cracks, potholes, and uneven surfaces. The RDD2020 dataset is used for model training, with preprocessing steps including augmentation, normalization, and resizing. A Convolutional Neural Network (CNN) model is trained through Teachable Machine for ease of customization. TensorFlow Lite is employed for on-device inference, with optimization techniques like quantization and pruning applied to improve speed and reduce model size. The system is evaluated using precision, recall, F1-score, and accuracy metrics under varying lighting and weather conditions. The final model is deployed in a mobile app using TensorFlow Lite Interpreter for efficient performance. Experimental results show high detection accuracy, with a precision of X% and F1-score of Y% (insert actual values). This approach offers a lightweight, cost-effective solution for road maintenance authorities and urban planners. Future enhancements include dataset expansion, integration with mapping tools, and improved robustness in diverse environments. Overall, the proposed system enables real-time, accurate road damage detection and supports smarter, eco-friendly infrastructure management.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Lusindah Nova, Yan Riantohttps://www.journal.irpi.or.id/index.php/malcom/article/view/1950Perbandingan Kinerja Algoritma Clustering K-Means dan K-Medoids dalam Pengelompokan Sekolah di Provinsi Riau Berdasarkan Ketersediaan Sarana dan Prasarana2025-02-12T02:42:09+00:00Muhammad Dzaki Salmanmuhammaddzakisalman@gmail.comRahmaddeni Rahmaddenirahmaddeni@sar.ac.idNanda Rizki Pratama rizkiperawang28@gmail.comM. Nakhlah Farid Anakhlahfarid@gmail.comAhmad Agung Setiawanbwaahmadagung@gmail.comFenisya Zaliantideswita0999@gmail.comIsra Bil Hudaisrabilhuda239@gmail.com<p>Pendidikan yang berkualitas sangat dipengaruhi oleh ketersediaan sarana dan prasarana yang memadai. Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma <em>clustering</em>, yaitu <em>K-Means</em> dan <em>K-Medoids,</em> dalam mengelompokkan 497 sekolah negeri di Provinsi Riau yang terdiri dari jenjang SD, SMP, SMA, dan SMK. Data yang dianalisis meliputi jumlah guru, siswa, ruang kelas, laboratorium, akses internet, sanitasi, dan status akreditasi. Data diperoleh dari Dinas Pendidikan dan Badan Pusat Statistik (BPS) Provinsi Riau, kemudian dianalisis melalui <em>Exploratory Data Analysis (</em>EDA<em>),</em> <em>preprocessing,</em> dan reduksi dimensi dengan <em>Principal Component Analysis (</em>PCA<em>).</em> Hasil evaluasi menggunakan <em>Davies-Bouldin Index (</em>DBI<em>)</em> dengan k=3 menunjukkan bahwa <em>K-Medoids</em> menghasilkan <em>cluster</em> yang lebih terpisah dan lebih baik (0,61) dibandingkan <em>K-Means</em> (0,80). Keunggulan <em>K-Medoids</em> terletak pada ketahanannya terhadap <em>outlier</em> dan distribusi data yang tidak merata. Hasil penelitian ini dapat digunakan sebagai acuan dalam perencanaan kebijakan pendidikan yang lebih merata dan tepat sasaran di Provinsi Riau.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Muhammad Dzaki Salman, Rahmaddeni, Nanda Rizki Pratama , M. Nakhlah Farid A, Ahmad Agung Setiawan , Fenisya Zalianti, Isra Bil Hudahttps://www.journal.irpi.or.id/index.php/malcom/article/view/1943Pengunaan Barcode dalam Sistem Inventory Modern untuk Meningkatkan Akurasi dan Kecepatan Operasional2025-01-26T02:29:27+00:00Sahidin Achmad Noor Maulana202151005@std.umk.ac.idEsti Wijayantiesti.wijayanti@umk.ac.idAhmad Abdul Chamidabdul.chamid@umk.ac.id<p>Pengelolaan stok di gudang sering menghadapi tantangan seperti kesalahan pencatatan, inefisiensi proses, dan kurangnya transparansi data. Untuk mengatasinya, penelitian ini bertujuan merancang dan mengimplementasikan aplikasi inventory berbasis barcode guna meningkatkan efisiensi dan akurasi operasional. Aplikasi dilengkapi dengan fitur seperti pendaftaran produk, pemindaian barcode untuk barang masuk dan keluar, serta pencatatan riwayat transaksi secara real-time dan terintegrasi. Teknologi barcode memungkinkan pencatatan otomatis yang dapat mengurangi kesalahan manusia dan mempercepat proses pengelolaan stok. Metode pengembangan sistem yang digunakan adalah metode <em>Prototyping,</em> yang memungkinkan pengembangan sistem dilakukan secara bertahap melalui pembuatan model awal dan penyempurnaan berkelanjutan berdasarkan umpan balik pengguna. Pendekatan ini sesuai diterapkan dalam kondisi di mana kebutuhan sistem belum sepenuhnya terdefinisi sejak awal. Studi kasus dilakukan pada sebuah gudang distribusi untuk menguji potensi aplikasi dalam meningkatkan keandalan data dan transparansi pelaporan. Penelitian ini diharapkan dapat memberikan kontribusi terhadap pengembangan sistem inventory yang lebih adaptif, akurat, dan efisien di sektor logistik dan distribusi.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Sahidin Achmad Noor Maulana; Esti Wijayanti, Ahmad Abdul Chamidhttps://www.journal.irpi.or.id/index.php/malcom/article/view/1813Eksplorasi Variabel Berpengaruh dan Akurasi Algoritma Naive Bayes Classifier untuk Mengklasifikasikan Performa Siswa Sekolah Dasar2024-12-08T00:05:18+00:00Arini Aha Pekuwaliarini.pekuwali@unkriswina.ac.idVidriana Oktoviana Banovidri.bano@unkriswina.ac.idAlfred Domu D. Panjaarini.pekuwali@unkriswina.ac.idFajar Indra Prasetyoeternalsnow333@gmail.com<p>Literasi numerasi memungkinkan seseorang untuk menggunakan angka dan simbol matematika dasar guna menyelesaikan tantangan praktis dalam kehidupan sehari-hari. Data perkembangan kemampuan matematika di antara siswa Indonesia melalui penilaian <em>Program for International Student Assessment</em> (PISA) pada tahun 2022, menunjukkan bahwa Indonesia berada pada posisi ke-71 dari 81 negara. Hasil PISA yang rendah tersebut terkonfirmasi oleh hasil nilai Asesmen Kompetensi Minimum (AKM) literasi numerasi Sumba Timur yang berada di angka 33,37 (skala 0-100) pada tahun 2023. Nilai PISA dan AKM yang sangat rendah menunjukkan rendahnya pondasi kemampuan matematika anak, sehingga perlu adanya pengidentifikasian sejak dini kepada siswa Sekolah Dasar (SD). Perkembangan data dalam konteks pendidikan dan evolusi pendidikan modern telah mendorong penggunaan berbagai teknik data mining untuk memantau performa siswa dengan cara-cara penelusuran yang beragam untuk menganalisis dan menemukan informasi yang tersembunyi dalam sistem pendidikan. Data mining pada data pendidikan biasa disebut dengan educational data mining (EDM). Penelitian dilakukan dengan mengumpulkan data hasil belajar siswa SD kelas 4 untuk mata pelajar matematika dan beberapa data demografis siswa. Melalui penelitian ini diketahui bahwa variabel RT1, RT2, dan PTS memiliki hubungan yang kuat dengan variabel terikat PAS. Model yang dibentuk oleh Algoritme Naive Bayes berhasil mengklasifikasikan performa belajar siswa dengan akurasi sebesar 92%.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Arini Aha Pekuwali, Vidriana Oktoviana Bano, Alfred Domu D. Panja, Fajar Indra Prasetyohttps://www.journal.irpi.or.id/index.php/malcom/article/view/1972Perbandingan Algoritma K-Nearest Neighbors dan Random Forest untuk Rekomendasi Gaya Hidup Sehat dalam Mencegah Penyakit Jantung2025-02-19T08:03:22+00:00Elza Sahelvirrcode9@gmail.comPutri Cikitaputricikita21@gmail.comRiska Mela Sapitririskamelasafitri123@gmail.comRahmaddeni RahmaddeniRahmaddeni@usti.ac.idLusiana EfrizoniLusiana@stmik-amik-riau.ac.id<p>Penyakit jantung merupakan salah satu penyebab utama kematian yang disebabkan oleh faktor gaya hidup tidak sehat. Untuk mengatasi permasalahan ini, penelitian ini membandingkan algoritma <em>K-Nearest Neighbors</em> (KNN) dan <em>Random Forest</em> (RF) dalam memberikan rekomendasi gaya hidup sehat guna mencegah penyakit jantung. Dataset yang digunakan terdiri dari 1.025 entri dengan 14 fitur, yang telah melalui tahap <em>preprocessing</em>, termasuk normalisasi, seleksi fitur, dan pembagian data 80:20 serta 70:30. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa <em>Random Forest</em> memiliki akurasi lebih tinggi (99% pada skenario 80:20 dan 98% pada skenario 70:30) dibandingkan KNN (83% dan 86%), serta lebih stabil dalam mengklasifikasikan risiko penyakit jantung. Analisis fitur menunjukkan bahwa <em>Chest Pain Type</em> (CP) atau nyeri dada merupakan faktor paling berpengaruh. Berdasarkan hasil ini, direkomendasikan pola makan sehat, aktivitas fisik teratur, manajemen stres, serta pemeriksaan kesehatan rutin. Kesimpulannya, <em>Random Forest</em> lebih efektif dalam sistem rekomendasi gaya hidup sehat, dan penelitian selanjutnya dapat menggunakan dataset lebih besar dengan variabel tambahan guna meningkatkan akurasi prediksi.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Elza Sahelvi, Putri Cikita, Riska Mela Sapitri, Rahmaddeni Rahmaddeni, Lusiana Efrizonihttps://www.journal.irpi.or.id/index.php/malcom/article/view/1989Implementasi Computer Vision dalam Mendeteksi Penyakit pada Tanaman Cabai dan Tomat Menggunakan Algoritma Convolutional Neural Networks2025-03-04T14:43:36+00:00Deris Pakidingpakidingd86@gmail.comAhmad Selaoahmadselao@umpar.ac.idWahyuddin Wahyuddinwahyuddin081090@gmail.com<p>Computer Vision banyak diterapkan dalam bidang pertanian untuk mendeteksi penyakit tanaman secara otomatis. Penelitian ini mengembangkan aplikasi berbasis web menggunakan Algoritma Convolutional Neural Networks (CNN) untuk mendeteksi penyakit pada tanaman cabai dan tomat. Aplikasi ini dibangun dengan HyperText Markup Language (HTML), Cascading Style Sheets (CSS), Python, JavaScript, dan Flask, memungkinkan pengguna mengunggah gambar tanaman untuk diklasifikasikan. Model CNN mencapai akurasi pelatihan 91%. Saat diuji menggunakan dataset terpisah, model memperoleh akurasi tinggi. Namun, setelah diterapkan dalam aplikasi untuk deteksi nyata, akurasi menurun menjadi 75%, yang bisa disebabkan oleh kondisi pencahayaan, kualitas gambar, dan perbedaan dataset. Kesalahan untuk deteksi nyata terutama terjadi pada kelas Cabai Leaf Curl 50% dan Tomat Normal 40% dari masing-masing 10 kali uji deteksi sampel. Analisis kinerja model menggunakan precision, recall, dan F1-score menunjukkan bahwa Cabai Leaf Curl memiliki recall tertinggi sebesar 0.9619 dan memiliki precision tertinggi 0.9711. Sementara pada Tomat Late Blight mendapatkan skor terendah pada Recall 0.7594 dan F1-Score 0.8510, menunjukkan tantangan dalam klasifikasi. Analisis heatmap mengungkapkan bahwa model berfokus pada fitur gambar tertentu tetapi tidak selalu pada area penyakit. Peningkatan kinerja melalui optimasi preprocessing data, augmentasi gambar, dan arsitektur model yang lebih kompleks diperlukan untuk meningkatkan akurasi serta mengurangi kesalahan klasifikasi.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Deris Pakiding, Ahmad Selao, Wahyuddin Wahyuddinhttps://www.journal.irpi.or.id/index.php/malcom/article/view/1975Model Prediksi Dampak Perubahan Iklim pada Ketahanan Pangan Menggunakan Algoritma Support Vector Machine and K-Nearest Neighbors2025-02-19T07:55:33+00:00Devi Puspita Sari2210031802018@sar.ac.idRisman Risman2210031802103@sar.ac.idFitra Maulana2210031802112@sar.ac.idLusiana Efrizonilusiana@stmik-amik-riau.ac.idRahmaddeni Rahmaddenirahmaddeni@usti.ac.id<p>Perubahan iklim memberikan dampak signifikan terhadap ketahanan pangan global, terutama di wilayah yang sangat bergantung pada sektor agrikultur. Fenomena seperti curah hujan ekstrem, kenaikan suhu, dan perubahan pola angin telah memengaruhi produktivitas pertanian secara signifikan. Urgensi penelitian ini terletak pada pentingnya pengembangan model prediktif berbasis data untuk mengantisipasi dampak perubahan iklim terhadap ketahanan pangan, sehingga strategi adaptasi dapat dirancang secara tepat oleh pembuat kebijakan. Penelitian ini bertujuan mengembangkan model prediksi dampak perubahan iklim terhadap ketahanan pangan dengan memanfaatkan algoritma Support Vector Machine (SVM) dan <em>K-Nearest Neighbors </em>(KNN). <em>Dataset </em>yang digunakan meliputi data meteorologi harian, seperti curah hujan (<em>precipitation</em>), suhu maksimum (<em>temp_max</em>), suhu minimum (<em>temp_min</em>), dan kecepatan angin (<em>wind</em>), yang diperoleh dari <em>Kaggle</em> (<em>Seattle</em> <em>weather</em>). Model SVM diterapkan untuk menangkap hubungan non-linear antara parameter iklim dengan indikator ketahanan pangan, sedangkan KNN digunakan untuk menganalisis pola serupa pada data historis. Hasil penelitian menunjukkan bahwa SVM memiliki akurasi prediksi sebesar 78%, lebih unggul dibandingkan KNN yang mencapai akurasi 74%. Temuan ini membuktikan bahwa SVM lebih efektif dalam memodelkan keterkaitan antara variabel iklim dan ketahanan pangan. Dengan demikian, penelitian ini berhasil mencapai tujuannya dan memberikan kontribusi penting dalam pengembangan sistem prediksi berbasis machine learning untuk mendukung kebijakan pangan yang adaptif terhadap perubahan iklim.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Devi Puspita Sari, Risman Risman, Fitra Maulana, Lusiana Efrizoni, Rahmaddeni Rahmaddenihttps://www.journal.irpi.or.id/index.php/malcom/article/view/2046Perbandingan Performa Random Forest dan Long Short-Term Memory dalam Klasifikasi Teks Multilabel Terjemahan Hadits Bukhari2025-05-12T23:03:41+00:00Rizmah Zakiah Nur Ahmad12150122153@students.uin-suska.ac.idNazruddin Safaat Harahapnazruddin.safaat@uin-suska.ac.idSurya Agustiansurya.agustian@uin-suska.ac.idIwan Iskandariwan.iskandar@uin-suska.ac.idSuwanto Sanjayasuwantosanjaya@uin-suska.ac.id<p>Hadits merupakan fondasi utama kedua dalam Islam, yang memandu umat Islam dalam menafsirkan nilai-nilai Islam dan mengimplementasikannya secara nyata dalam berbagai aspek kehidupan. Salah satu perawi hadits yang paling dihormati adalah Imam Bukhari, yang dikenal dengan ketelitian dan ketegasannya dalam memilih hadits-hadits yang otentik. Penelitian ini menggunakan data dari terjemahan hadis dari Sahih Bukhari ke dalam bahasa Indonesia yang telah diklasifikasikan ke dalam tiga kategori utama, yaitu anjuran, larangan, dan informasi. Untuk mengidentifikasi karakteristik masing-masing kategori, klasifikasi teks dilakukan dengan menggunakan dua metode populer, yaitu Random Forest (RF) dan Long Short-Term Memory (LSTM), yang dikenal efektif dalam memproses data teks berskala besar dan kompleks. Tujuan dari penelitian ini adalah untuk menguji perbedaan kinerja antara kedua metode tersebut dalam mengelompokkan hadis yang datanya telah lengkap. Hasil evaluasi menunjukkan bahwa metode RF mencapai akurasi tertinggi sebesar 89,48%, sedikit lebih unggul dari LSTM yang memperoleh 88,52%. Kedua metode mencatat nilai Hamming Loss yang sama, yaitu 0,1048 (89,52%). Temuan ini menunjukkan bahwa kelengkapan dan kualitas data hadis Bukhari berkontribusi dalam meningkatkan akurasi klasifikasi dengan memberikan konteks dan variasi yang lebih baik untuk model.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Rizmah Zakiah Nur Ahmad, Nazruddin Safaat Harahap, Surya Agustian, Iwan Iskandar, Suwanto Sanjayahttps://www.journal.irpi.or.id/index.php/malcom/article/view/1987Analisis Faktor-Faktor yang Mempengaruhi Engagement Video di Platform TikTok Menggunakan Multiple Linear Regression2025-02-27T10:09:29+00:00Nur Sapina2310031802147@sar.ac.idAnnisa Nanda2417052802081@usti.ac.idMuhammad Amirul Arifin2417052802086@usti.ac.idRahmaddeni Rahmaddenirahmaddeni@usti.ac.idLusiana Efrizonilusiana@stmik-amik-riau.ac.id<p><em>TikTok </em>telah berkembang menjadi salah satu platform interaksi digital terkenal secara luas di seluruh dunia, yang memiliki lebih dari satu miliar orang pengguna aktif. Namun, sebagian video di <em>TikTok</em> memperoleh tingkat engagement yang tinggi meskipun menggunakan pendekatan konten yang serupa. Riset ini dimaksudkan untuk menelusuri unsur-unsur yang memberikan pengaruh terhadap <em>engagement</em> video di TikTok dengan menerapkan algoritma Regresi Linear Berganda. Variabel yang dianalisis meliputi durasi video, jumlah tayangan, komentar, <em>like, share</em>, dan <em>download</em>. Setelah melalui tahap preprocessing data, seleksi fitur, dan pengujian asumsi regresi, ditemukan bahwa <em>video_like_count</em>, <em>video_share_count</em>, dan <em>video_download_count</em> memiliki pengaruh paling signifikan terhadap jumlah tayangan. Hasil evaluasi model membuktikan bahwa model regresi menujukkan kinerja prediktif yang sangat baik, dengan nilai <em>R² Squared</em> sebesar 0,978, <em>RMSE</em> sebesar 0,0742, dan <em>MSE</em> sebesar 0,0055. Riset ini memberikan gambaran praktis kepada konten kreator dan konten marketing dalam merancang produksi konten yang lebih optimal. Model prediksi ini juga dapat dimanfaatkan untuk memperkirakan potensi engagement suatu video sebelum dipublikasikan.</p>2025-06-19T00:00:00+00:00Copyright (c) 2025 Nur Sapina, Annisa Nanda, Muhammad Amirul Arifin, Rahmaddeni Rahmaddeni, Lusiana Efrizonihttps://www.journal.irpi.or.id/index.php/malcom/article/view/1992Implementasi Feature Selection Menggunakan Boruta untuk Peningkatan Akurasi Model Lapser Prediction2025-03-14T00:18:05+00:00Mochamad Gilang Saputramochamadgilangsaputra92@gmail.comBagus Jati Santosobagus@if.its.ac.id<p>Memprediksi pelanggan <em>lapser</em> menjadi tantangan utama di sektor layanan data yang kompetitif, disertai tingginya biaya akuisisi pelanggan baru. Penelitian ini mengusulkan pendekatan <em>feature selection</em> menggunakan <em>Boruta</em> untuk meningkatkan akurasi <em>model lapser</em>, dengan menerapkan teknik <em>wrapper</em> pada <em>Random Forest</em>. Proses <em>modeling lapser prediction </em>menggunakan<em> a</em>lgoritma <em>machine learning Gradient Boosting</em> yang dianalisis sebelum dan sesudah seleksi fitur <em>Boruta</em>. Hasil eksperimen pada data menunjukkan bahwa <em>Boruta</em> efektif dalam meningkatkan metrik utama (akurasi, <em>recall</em>, dan AUC). Model Gradient Boosting meraih akurasi hingga 75.10%, <em>recall</em> 74.42%, dan AUC 82.18% setelah menggunakan <em>Boruta</em>. Sebelum menggunakan B<em>oruta</em> nilai akurasi 71.74%, <em>recall</em> 68.74%, dan AUC hanya 77.77%. Temuan tersebut menegaskan bahwa pendekatan yang diusulkan dapat memprediksi <em>lapser</em> secara lebih dini, serta membantu penyusun kebijakan menyusun strategi retensi pelanggan yang lebih efektif, sehingga meminimalkan potensi kerugian dan memperkuat daya saing di pasar.</p>2025-06-24T00:00:00+00:00Copyright (c) 2025 Mochamad Gilang Saputra, Bagus Jati Santosohttps://www.journal.irpi.or.id/index.php/malcom/article/view/2051Perbandingan Performa Metode Klasifikasi Teks Multilabel Hadis Terjemahan Bukhari Menggunakan Support Vector Machine dan Long Short Term Memory2025-05-16T07:35:32+00:00Aulia Ramadhani12150124752@students.uin-suska.ac.idNazruddin Safaatnazruddin.safaat@uin-suska.ac.idSurya Agustiansurya.agustian@uin-suska.ac.idIwan Iskandariwan.iskandar@uin-suska.ac.idSuwanto Sanjayasuwantosanjaya@uin-suska.ac.id<p>Hadis merupakan sumber hukum kedua dalam Islam, dan salah satu kitab hadis yang paling dikenal adalah Shahih al-Bukhari. Untuk mendukung pemahaman dan pengamalan yang tepat, hadis perlu diklasifikasikan secara akurat. Mengingat satu hadis dapat mengandung lebih dari satu informasi, pendekatan klasifikasi <em>multilabel</em> menjadi sangat relevan. Penelitian ini bertujuan untuk memberikan kontribusi dalam bidang klasifikasi teks dengan mengeksplorasi kombinasi metode dan parameter yang optimal untuk klasifikasi <em>multilabel</em> hadis. Hasil penelitian menunjukkan bahwa Support Vector Machine (SVM) memberikan performa terbaik pada label Larangan dengan Macro F1-score sebesar 82,57%, melalui kombinasi SVM + TF-IDF menggunakan kernel = linear, parameter C (<em>regularization parameter</em>) = 1 tanpa stopword removal dan tanpa balancing. Sementara itu, Long Short Term Memory (LSTM) juga unggul pada label Larangan dengan Macro F1-score 82,66% pada kombinasi parameter Epoch = 20, Dropout = 0.5, Dense = 128 dan Batch Size = 64 tanpa stopword removal dan tanpa balancing kombinasi ini juga menghasilkan nilai Hamming Loss terendah sebesar 10,452%, yang lebih baik dibandingkan dengan penelitian sebelumnya serta menunjukkan bahwa LSTM terbukti lebih efektif secara keseluruhan dengan penyetelan parameter yang tepat. Penelitian ini juga berkontribusi dalam peningkatan kualitas data dengan melengkapi matan hadis yang digunakan, sehingga menghasilkan performa klasifikasi yang lebih baik.</p>2025-06-24T00:00:00+00:00Copyright (c) 2025 Aulia Ramadhani, Nazruddin Safaat, Surya Agustian, Iwan Iskandar, Suwanto Sanjayahttps://www.journal.irpi.or.id/index.php/malcom/article/view/2052Klasifikasi Sentimen Menggunakan Metode Multilayer Perceptron dengan Fitur TF-IDF2025-05-16T07:51:10+00:00Abdurrahman Arasy11950114943@students.uin-suska.ac.idSurya Agustiansurya.agustian@uin-suska.ac.idLestari Handayanilestari.handayani@uin-suska.ac.idIwan Iskandariwan.iskandar@uin-suska.ac.id<p>Media sosial, khususnya Twitter (X), telah menjadi platform utama dalam diskusi politik dan kebijakan pemerintah. Istilah dalam pengiriman pesan pada Twitter dikenal sebagai Tweet yang terdiri dari pesan dengan maksimal 280 karakter. Meskipun Tweet seringkali hanya berupateks, juga dapat menyertakan hyperlink, video, dan jenis media lainnya yang dapat digunakan untuk mengukur opini publik. penelitian ini bertujuan mengklasifikasikan sentimen masyarakat terkait pengangkatan Kaesang Pangarep sebagai Ketua Umum Partai Solidaritas Indonesia (PSI) dengan metode Multi-Layer Perceptron (MLP) Classifier dengan pendekatan Term Frequency-Inverse Document Frequency (TF-IDF) menggunakan bahasa pemograman python. Data yang digunakan terdiri dari 300 tweet, dengan 100 tweet perkelas atau opsi untuk hasil yang optimal. Tiga kategori tersebut adalah positif, netral, dan negatif. Berdasarkan penelitian yang telah dilakukan metode terbaik mencapai F1-score sebesar 0,6767 dan akurasi 0,6667. Hasil ini menunjukkan bahwa kombinasi MLP Classifier dan TF-IDF dapat mengatasi keterbatasan dataset hingga tingkat tertentu dibandingkan metode baseline. Penelitian ini juga memberikan wawasan tentang optimasi klasifikasi sentimen dalam kondisi data terbatas, yang dapat diterapkan pada topik lain dengan permasalahan serupa</p>2025-06-24T00:00:00+00:00Copyright (c) 2025 Abdurrahman Arasy, Surya Agustian, Lestari Handayani, Iwan Iskandarhttps://www.journal.irpi.or.id/index.php/malcom/article/view/2082Implementasi Chatbot Tafsir Al-Qur'an Menggunakan Chainlit dengan Pendekatan Groq2025-06-04T00:24:04+00:00Muhammad Rizky Maulana12150114879@students.uin-suska.ac.idNazruddin Safaat Harahapnazruddin.safaat@uin-suska.ac.idOkfalisa Okfalisaokfalisa@gmail.comYusra Yusrayusra@uin-suska.ac.id<p>Pemahaman terhadap tafsir Al-Qur’an sering kali menjadi tantangan dalam dunia pendidikan, khususnya bagi siswa, mahasiswa, atau masyarakat umum yang tidak memiliki latar belakang ilmu tafsir maupun kemampuan bahasa Arab. Keterbatasan akses terhadap tafsir yang mudah dipahami, serta ketiadaan media pembelajaran yang interaktif dan mampu menjawab pertanyaan secara kontekstual, menjadi hambatan dalam proses pembelajaran keislaman. Penelitian ini bertujuan untuk mengembangkan chatbot berbasis kecerdasan buatan (AI) sebagai media pendukung pembelajaran tafsir Al-Qur’an yang responsif dan adaptif. Sistem dirancang menggunakan framework <em>Chainlit</em> sebagai antarmuka web, didukung oleh Groq untuk mempercepat proses inferensi, serta integrasi LangChain dan Large Language Models (LLM) untuk memahami isi tafsir, khususnya Tafsir Jalalain dalam format PDF berbahasa Indonesia. Dokumen yang digunakan berupa satu file digital utuh yang representatif. Proses sistem meliputi ekstraksi teks, pembagian teks (chunking), pembentukan embedding, dan pencarian semantik berbasis vektor. Evaluasi menggunakan BERTScore menghasilkan nilai rata-rata precision sebesar 71,84%, recall 78,11%, dan F1-score 74,80%, menunjukkan kemampuan sistem dalam memberikan jawaban yang baik secara semantik. Hasil penelitian ini berkontribusi dalam menyediakan media pembelajaran tafsir digital berbasis AI yang efisien dan kontekstual, serta menjadi solusi potensial untuk mendukung proses pendidikan Islam yang lebih interaktif dan modern.</p>2025-06-25T00:00:00+00:00Copyright (c) 2025 Muhammad Rizky Maulana, Nazruddin Safaat Harahap, Okfalisa Okfalisa, Yusra Yusra