Deteksi Penyakit Jantung Menggunakan Metode Klasifikasi Decision Tree dan Regresi Logistik

Fahren Bukhari, Sri - Nurdiati, Mohamad Khoirun Najib, Rizki Nurul Amalia

Abstract


Penyakit jantung merupakan salah satu penyakit paling umum dan kritis yang membahayakan kehidupan manusia. Selain diagnosis klinis, pembelajaran mesin dan pendekatan berbasis pembelajaran mendalam sangat penting dalam diagnosis penyakit jantung, seperti decision tree dan regresi logistik. Penelitian ini bertujuan membandingkan kedua metode klasifikasi tersebut untuk mendeteksi adanya penyakit jantung berdasarkan beberapa indikator. Data yang digunakan adalah data penyakit jantung yang dikeluarkan oleh University of California, Irvine (UCI) Machine Learning Repository.  Berdasarkan hasil yang diperoleh, model decision tree yang terbentuk menempatkan variabel thal (tipe detak jantung pasien) sebagai simpul akar, dikarenakan nilai entropy yang paling tinggi. Model decision tree memiliki akurasi terhadap data uji sebesar 75%. Sementara itu, model regresi logistik menempatkan variabel sex, cp_3, slope_1, ca, dan thal_2 sebagai variabel-variabel yang berpengaruh nyata. Model regresi logistik memiliki akurasi terhadap data uji sebesar 87%. Dari akurasi dari kedua model tersebut, regresi logistik lebih akurat untuk mendeteksi adanya penyakit jantung dibandingkan model decision tree.


Keywords


Decision tree; regresi logistik; prediksi penyakit jantung; data mining

Full Text:

PDF

References


Mustika, Ardilla, Y., Manuhutu, A., Ahmad, N., Hasbi, I., Guntoro, Manuhutu, A. M., Ridwan, M., & Hozairi. (2021). Data Mining dan Aplikasinya. Widiana Bhakti Persada.

Anggriyani, I. R., Kusumawati, E. D., & Kawulur, E. I. J. J. (2022). etode Regresi Logistik Biner dan Metode K-Nearest Neighbor Pada Klasifikasi Menopause Dini Wanita Distrik Oransbari Provinsi Papua Barat. UNEJ E-Proceeding.

Hosmer, D. W., & Lemeshow, S. (2000). Applied Logistic Regression (2nd ed.). John Wiley & Sons, Inc. https://doi.org/10.1002/0471722146

Ye, N. (2014). Data Mining: Theories, Algorithms, and Examples. CRC Press. https://doi.org/10.1201/b15288

Asmianto, Pusawidjayanti, K., Hafiizh, M., & Supeno, I. (2022). Comparative of Classification Algorithm: Decision Tree, SVM, and KNN for Heart Diseases Prediction. AIP Conference Proceedings, 2639. https://doi.org/10.1063/5.0110243

Ambrish, G., Ganesh, B., Ganesh, A., Srinivas, C., Dhanraj, & Mensinkal, K. (2022). Logistic regression technique for prediction of cardiovascular disease. Global Transitions Proceedings, 3(1), 127–130. https://doi.org/10.1016/j.gltp.2022.04.008

Albert, A. J., Murugan, R., & Sripriya, T. (2023). Diagnosis of heart disease using oversampling methods and decision tree classifier in cardiology. Research on Biomedical Engineering, 39(1), 99–113. https://doi.org/10.1007/s42600-022-00253-9

Babič, Š. H., Kokol, P., Podgorelec, V., Zorman, M., Šprogar, M., & Štiglic, M. M. (2000). The art of building decision trees. Journal of Medical Systems, 24(1), 43–52. https://doi.org/10.1023/A:1005437213215

Larose, D. T., & Larose, C. D. (2014). Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition. In Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition (Vol. 9780470908). John Wiley & Sons, Inc. https://doi.org/10.1002/9781118874059

Quinlan, J. R. (1993). C4.5 - Programs for Machine Learning. Morgan Kaufmann Publisher, Inc.

Merawati, D., & Rino. (2019). Penerapan data mining penentu minat Dan bakat siswa SMK dengan metode C4.5. Jurnal Algor, 1(1), 28–37.

Safitri, A., Sudarmin, S., & Nusrang, M. (2019). Model Regresi Logistik Biner pada Tingkat Pengangguran Terbuka di Provinsi Sulawesi Barat Tahun 2017. VARIANSI: Journal of Statistics and Its Application on Teaching and Research, 1(2), 1. https://doi.org/10.35580/variansiunm9354

Mahmudin, M. Z., Rindengan, A., & Weku, W. (2014). Penggunaan Association Rule Data Mining Untuk Menentukan Pola Lama Studi Mahasiswa F-MIPA UNSRAT. D’CARTESIAN, 3(1), 1. https://doi.org/10.35799/dc.3.1.2014.3777

Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing and Management, 45(4), 427–437. https://doi.org/10.1016/j.ipm.2009.03.002

Garavaglia, S., & Sharma, A. (1998). a Smart Guide To Dummy Variables : Four Applications and a Macro. Proceedings of the Northeast SAS Users Group Conference, 43.




DOI: http://dx.doi.org/10.30872/jsakti.v5i1.10780

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Sains, Aplikasi, Komputasi dan Teknologi Informasi

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

 

2nd Floor, Faculty of Computer Science and Information Technology
Jl. Panajam Kampus Gn. Kelua Universitas Mulawarman Samarinda-Kalimantan Timur 75123
Phone: +62 813 31112002 (Haviluddin) +62 811 8207777 (Reza)
E-Mail: jurnal.sakti.fkti@gmail.com; sakti@unmul.ac.id

Creative Commons License
Sains, Aplikasi, Komputasi dan Teknologi Informasi by http://e-journals.unmul.ac.id/index.php/jsakti eISSN: 2684-8473 is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.