Penggunaan Metode Logistic Regression Ensemble (LORENS) pada Klasifikasi Leukemia Akut

Samira Ratnawati, Siti Sunendiari

Abstract


Abstract. Logistic Regression Ensemble (LORENS) is a development of the logistic regression method that uses the ensemble technique (merger) to obtain classification predictions. The advantage of LORENS when compared to logistic regression, if the data are high dimensional or if the number of predictor variables (X) is more than the number of samples. For high dimensional data, logistic regression will produce inaccurate predictions because there are several problems arise, so LORENS is the solution for classifying with high dimensional data. Estimation of logistic regression parameters use the maximum likelihood method assisted by Newton-Raphson iteration. A logistic regression model was built in each sub space, from the model obtained predictive values by substituting testing data. LORENS is assisted by the LR-CERP (Logistic Regression Classification by Ensembles from Random Partitions) algorithm in combining logistic regression models that are formed in each partition and compiling an ensemble. LORENS repeated the LR-CERP algorithm to produce  ensemble and  classification predictions. To produce final classification accuracy, LORENS will select the most classifications. In this thesis, LORENS method will be applied in the classification of acute leukemia which is expected to produce accurate predictions. The  results of the research, the accuracy value is 78.57%, which means that the LORENS method can accurately predict 78.57%.

Keywords: Acute Leukemia, Logistic Regression Ensemble (LORENS), Logistic Regression

Abstrak. Logistic Regression Ensemble (LORENS) merupakan perkembangan dari metode regresi logistik yang menggunakan teknik ensemble (penggabungan) untuk memperoleh prediksi klasifikasi. Kelebihan LORENS jika dibandingkan dengan regresi logistik yaitu jika data yang digunakan berdimensi tinggi atau jika jumlah variabel prediktor (X) lebih banyak dari jumlah sampel. Untuk data yang berdimensi tinggi regresi logistik akan menghasilkan prediksi yang tidak akurat karena ada beberapa masalah yang ditimbulkan, sehingga LORENS adalah solusi untuk pengklasifikasian dengan data berdimensi tinggi. Estimasi parameter regresi logistik menggunakan metode maximum likelihood dibantu dengan iterasi Newton-Raphson. Model regresi logistik dibangun setiap sub ruang, dari model didapat nilai prediksi dengan mensubtitusikan data testing. LORENS dibantu dengan algoritma LR-CERP (Logistic Regression Classification by Ensembles from Random Partitions) dalam menggabungkan model regresi logistik yang terbentuk di setiap partisi dan menyusun ensemble. LORENS mengulang algoritma LR-CERP sehingga menghasilkan  ensemble dan  prediksi klasifikasi. Untuk menghasilkan ketepatan klasifikasi akhir, LORENS akan memilih prediksi klasifikasi terbanyak.  Dalam skripsi ini akan diterapkan metode LORENS pada klasifikasi leukemia akut yang diharapkan menghasilkan prediksi yang akurat. Dari hasil penelitian didapat nilai akurasi sebesar 78,57% yang berarti metode LORENS dapat memprediksi secara tepat sebesar 78,57%.

Kata Kunci: Leukemia Akut, Logistic Regression Ensemble (LORENS), Regresi Logistik


Keywords


Leukemia Akut, Logistic Regression Ensemble (LORENS), Regresi Logistik

Full Text:

PDF

References


Ahn, Hongshik., Hojin Moon., Melissa, J.F., Noha Lim.., James J.C., & Ralph, L.K. (2007). Classification by Ensembles From Random Partitions of High-dimensional Data. Computational Statistics and Data Analysis, 51, 6167.

Asfihani, Ayu. (2015). Prediksi Pembelotan Konsumen Software Antivirus‘X’ Dengan Binary Logistic Regression Dan Logistic Regression Ensembles. Surabaya: Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya.

Catal, C. (2012). Performance Evaluation Metrics for Software Fault Prediction Studies. Acta Polytechnica Hungari-ca, Vol. 9, No. 4.

Hidayat. (2006). Pengantar Ilmu Keperawatan Anak. Jakarta. Salemba Medika.

Hosmer, D.W & S.Lemeshow. (2000). Applied Logistic Regression 2nd Edition. New York: John Willey and Sons.

Hoyyi, Abdul. (2011). Pemodelan Regresi Logistik dalam Penentuan Faktor-Faktor yang Berpengaruh Terhadap Penyakit Jantung Koroner. Semarang: Jurusan Statistika Fakultas MIPA Universitas Diponegoro.

Lim, Noha. (2007). Classification by Ensemble from Random Partitions using Logistic Regression Models. Stony Brook University: Ph.D. Thesis.

Muflihah, D., Kulsum Febri D.S., Dwi Andika M.S., Noor Rochmat H, Normalita Dwi P.S., Yusi Idah S., Alifah F.I., & Anggun Nilam C. (2016). Leukemia. Malang: Jurusan Keperawatan Politeknik Kesehatan Kementrian Kesehatan Malang.




DOI: http://dx.doi.org/10.29313/.v7i1.25555

Flag Counter