Klasifikasi Pasien Diabetes Melitus Tipe 1 dengan Metode Rotation Forest

Carolin Sonia Septeria, Lisnur Wachidah

Abstract


Abstract. Practitioners of data mining developers today, using the method of classifier ensembles between regression trees and classification trees in modeling a decision that generates conjectures (predictions) of existing data quickly. However, in certain data that has many variables will result in many decision trees, making visualizing the given results complicated to be synthesized. To solve the problem, Rotation forest is one of the methods of the ensembles classifier that uses the main component analysis or principal component analysis (PCA) to rotate the axis of the change that will be built by the decision tree so that it can model fewer decision trees with better accuracy, sensitivity and specificity than other class ensembles. In this study, rotation forest method was used to classify the symptoms that often appear in patients diagnosed with Diabetes Mellitus type 1 in Diabetes Mellitus (DM) patients at Sylhet Hospital, Bangladesh in 2020. The results of the application of rotation forest method in diabetes mellitus (DM) type 1 patient data at Sylhet Hospital, Bangladesh in 2020 are known that patients who have symptoms X2(Gender), X5(Sudden weight loss), X4(Polydipsia), X13(Partial paresis), X3(Polyuria), X7(Polyphagia), X6(Weakness), X9(Visual blurring), X14 (Muscle stiffness), X16(Obesity), X11(Irritability), X1(Age), X12(Delayed healing) and X10(Itching).  can be classified as type 1 diabetes patients with a modeling accuracy rate of 92.95%.

Keywords: type 1 diabetes mellitus, classification, Principal Component Analysis, Rotation Forest.

Abstrak. Praktisi pengembang data mining saat ini, menggunakan metode pohon gabungan (classifier ensembles) antara pohon regresi (regression tree) dengan pohon klasifikasi (classification tree) dalam melakukan pemodelan terhadap suatu keputusan yang menghasilkan dugaan (prediksi) dari data yang ada secara cepat. Namun, pada data tertentu yang memiliki banyak variabel akan menghasilkan banyak pohon keputusan sehingga membuat visualisasi hasil yang diberikan menjadi rumit untuk diintepretasikan. Untuk mengatasi permasalahan tersebut maka  Rotation forest adalah salah satu metode pohon gabungan (classifier ensembles) yang menggunakan analisis komponen utama atau principal component analysis (PCA) untuk merotasi sumbu peubah yang akan dibangun pohon keputusannya sehingga dapat memodelkan pohon keputusan yang lebih sedikit dengan nilai akurasi, sensitivitas dan spesifitas yang lebih baik dibandingkan metode pohon gabungan (classifier ensembles) lainnya. Pada penelitian ini, metode rotation forest digunakan untuk mengklasifikasi gejala-gejala yang sering muncul pada pasien terdiagnosis Diabetes Melitus tipe 1 pada pasien Diabetes Melitus (DM) di Rumah sakit Sylhet, Bangladesh tahun 2020. Hasil penerapan metode rotation forest pada data pasien Diabetes Melitus (DM) tipe 1 di Rumah sakit Sylhet, Bangladesh tahun 2020 diketahui bahwa pasien yang memiliki gejala X2(Gender), X5(Penurunan berat badan mendadak), X4(Mudah haus), X13(Setengah lumpuh), X3(Buang air kecil berlebih), X7(Makan berlebih), X6(Mudah lelah), X9(Pandangan kabur), X14(ketidakseimbangan kerja otot), X16(Obesitas), X11(Iritabilitas), X1(Umur), X12(Penyembuhan luka berlangsung lama) dan X10(Gatal-gatal).  dapat diklasifikasikan sebagai pasien diabetes tipe 1 dengan tingkat akurasi pemodelan sebesar 92,95%.

Kata Kunci: Diabetes melitus tipe 1, klasifikasi, Principal Component Analysis, Rotation Forest.

Keywords


Diabetes melitus tipe 1, klasifikasi, Principal Component Analysis, Rotation Forest

Full Text:

PDF

References


Bartholomew, D. J. (2010). Principal Components Analysis. International Encyclopedia of Education, 374–377.

Fawcett, T. (2006). An Introduction to ROC Analysis. Pattern Recognition Letters 27, 861–874.

Hosmer DW, Lemeshow S, Sturdivant RX. 2013. Applied Logistic Regression Third Edition. New Jersey (US): J Wiley.

Hair, J.F. Jr. , Anderson, R.E., Tatham, R.L., dan Black, W.C. 1998. Multivariate Data Analysis, (5 th. Edition). Upper Saddle River, NJ: Prentice Hall.

International Diabetes Federation. 2019. IDF DIABETES ATLAS : Ninth edition 2019.

Kohavi R. 1995. A Study Of Cross Validation And Bootstrap For Accuracy Estimation And Model Selection. Prosiding of the 14th International Joint Conference on Artrificial Intelligence. 2, 1137–1143.

M, Kuhn (2008). Building Predictive Models in R Using the caret Package. Journal of Statistical Software. 28(5). 1-26

Rodriguez, J., L. Kuncheva, and C. Alonso (2006). Rotation forest: A new classifier ensemble method. IEEE Transactions on Pattern Analysis and Machine Intellgince 28(10), 1619–1630.

Sartono, B., & Syafitri, U. D. (2010). Metode Pohon Gabungan : Solusi Pilihan Untuk Mengatasi Kelemahan Pohon Regresi Dan Klasifikasi Tunggal ( Ensemble Tree : An Alternative toward Simple Classification and Regression Tree). Forum Statistika dan Komputasi. 15(1), 1–7.

Sharma S. 1996. Applied Multivariate Techniques. New Jersey (US): J Wiley.

Wijaya, J., Soleh, A. M., & Rizki, A. (2018). Penanganan Data Tidak Seimbang pada Pemodelan Rotation Forest Keberhasilan Studi Mahasiswa Program Magister IPB. 2(2), 32–40.

Utama Muhammad Bangkit Riksa, Hajarisman Nusar. (2021). Metode Pemilihan Variabel pada Model Regresi Poisson Menggunakan Metode Nordberg. Jurnal Riset Statistika, 1(1), 35-42.




DOI: http://dx.doi.org/10.29313/.v0i0.28922

Flag Counter