Perbandingan Ketepatan Klasifikasi Analisis Regresi Model Logit Biner dan Model Probit Biner terhadap Faktor-Faktor yang Mempengaruhi Risiko Penyakit Jantung Koroner

Fitri Apriliyanti, Teti Sofia Yanti

Abstract


Abstract. The method to determine the relationship between the response variable and several predictor variables is linear regression. When the response variable is binary, the method used is binary logistic regression. Several approaches to developing models for explaining binary regression models are logit models and probit models. Logit models and probit models are commonly used to analyze the relationship between one response variable which is categorical data and several predictor variables. In this study, we want to know the best model between the binary logit model and the binary probit model using coronary heart disease risk data in the City of Framingham, America. From the results of the analysis that has been done, it can be concluded that the factors that influence the risk of coronary heart disease are gender, age, active smokers, cholesterol levels, BMI and glucose. The classification accuracy value of the binary logit regression method is 84.95% and the classification accuracy value of the binary probit method is 84.92%. From the comparison of the classification accuracy between the binary logit regression method and the binary probit method are relatively the same.

Keywords: Binary Logit Model Regression, Binary Probit Model Regression, Coronary Heart Disease.

Abstrak. Metode untuk mengetahui hubungan variabel respon dan beberapa variabel prediktor adalah regresi linier. Ketika variabel respon adalah biner, metode yang digunakan adalah regresi logistik biner. Beberapa pendekatan untuk mengembangkan model untuk menjelaskan model regresi biner adalah model logit dan model probit. Model logit dan model probit biasa digunakan untuk menganalisis hubungan antara satu variabel respon yang merupakan data kategorik dan beberapa variabel prediktor. Penyakit jantung kronis merupakan salah satu penyebab kematian nomor satu di dunia. Dalam penelitian ini, ingin mengetahui model terbaik antara model logit biner dan model probit biner dengan menggunakan data risiko penyakit jantung koroner di Kota Framingham Amerika. Dari hasil analisis yang telah dilakukan, dapat disimpulkan bahwa faktor yang mempengaruhi risiko penyakit jantung koroner adalah jenis kelamin, usia, perokok aktif, kadar kolesterol, IMT dan glukosa. Nilai ketepatan klasifikasi metode regresi logit biner sebesar 84,95% dan nilai ketepatan klasifikasi metode probit biner sebesar 84,92%. Dari hasil perbandingan ketepatan klasifikasi antara metode regresi logit biner dan metode probit biner relatif sama.

Kata Kunci: Regresi Model Logit Biner, Regresi Model Probit Biner, Penyakit Jantung Koroner.


Keywords


Regresi Model Logit Biner, Regresi Model Probit Biner, Penyakit Jantung Koroner.

Full Text:

PDF

References


Agresti, A. (2002). Categorical Data Analysis Second Edition. John Willey and Sons. New York.

Greene, W. H. (2008). Econometrics Analysis Sixth Edition. Prentice Hall: New Jersey.

Gujarati, D. N. (2004). Basic Econometrics. New York: McGraw-Hill Companies.

Hosmer, D. W., dan Lemeshow. (2000). Applied Logistic Regression. USA: John Willey and Sons.

Johnson, R. A., dan Wichern, D. W. (1992). Applied Multivariate Statistical Analysis. Prentice Hall: New Jersey.

Kleinbaum, D., dan Klein, M. (2002). Logistic Regression. New York: Spinger Verlag.

Setiawan, F. H., Rahmawati R., dan Suparti. (2014). Ketepatan Klasifikasi Keikutsertaan Keluarga Berencana Menggunakan Regresi Logistik Biner dan Regresi Probit Biner. Semarang: Jurnal Gausian.




DOI: http://dx.doi.org/10.29313/.v7i1.25633

Flag Counter