Pemodelan Faktor-Faktor yang Mempengaruhi Penyakit Tuberkulosis Menggunakan Metode Multivariate Adaptive Regression Spline (MARS) (Studi kasus Provinsi Jawa Barat, Jawa Timur dan Jawa Tengah tahun 2019)

Yunda Damayanti, Siti Sunendiari

Abstract


Abstract. Multivariate Adaptive Regression Spline (MARS) is a nonparametric regression approach that results from a spline with Recursive Partitioning Regression (RPR) which was first popularized by Friedman (1991). MARS is able to solve two main problems in statistics, namely prediction when the response variable is continuous and classification when the response variable is categorical. The MARS model is able to overcome the problem of high-dimensional data, namely data that has a number of predictor variables 3< p < 20 and large sample data and produces accurate predictions of response variables. The MARS model is based on the Generelazide Cross Validation (GCV) minimum value. Response variables used in this study using continuous data, namely the number of tuberculosis cases and the predictor variables used are the percentage of the poor (X1), population density (X2), the number of HIV sufferers (X3), the percentage of households using clean water (X4), the percentage of food processing places (TPM) that meet health requirements (X5), percentage of families with healthy basic sanitation facilities (X6) and percentage of public places that meet health requirements (X7). In this study, the best MARS model was obtained with a combination of 28, MI = 2 and MO = 2 with the minimum Generalized Cross Validation (GCV). There are 6 predictor variables that have a significant effect on the number of tuberculosis based on the level of importance of these variables.

Keywords: Nonparametric Regression, Multivariate Adaptive Regression Spline, Tuberculosis

Abstrak. Multivariate Adaptive Regression Spline (MARS) merupakan pendekatan regresi nonparametrik yang dihasilkan dari spline dengan Recursive Partitioning Regression (RPR) yang pertama kali di populerkan oleh Friedman (1991). MARS mampu menyelesaikan dua permasalahan utama dalam statistika, yaitu prediksi pada saat variabel responnya kontinu dan klasifikasi pada saat variabel responnya kategorik. Model MARS mampu mengatasi permasalahan data berdimensi tinggi, yaitu data yang memiliki jumlah variabel prediktor sebesar 3< p < 20 dan data sampel berukuran besar serta menghasilkan prediksi variabel respon yang akurat. Model MARS didasarkan pada nilai minimum Generelazide Cross Validation (GCV). Variabel respon yang digunakan dalam penelitian ini menggunakan data kontinu yaitu jumlah kasus tuberculosis dan variabel prediktor yang digunakan yaitu persentase penduduk miskin (X1), tingkat kepadatan penduduk (X2), jumlah penderita HIV (X3), persentase rumah tangga menggunakan air bersih (X4), persentase tempat pengolahan makanan (TPM) yang memenuhi syarat kesehatan (X5), persentase keluarga dengan kepemilikan sarana sanitasi dasar sehat (X6) dan persentase tempat umum yang memenuhi syarat kesehatan (X7). Pada penelitian ini diperoleh model MARS terbaik dengan kombinasi BF = 28, MI = 2 dan MO = 2 dengan kriteria nilai Generalized Cross Validation (GCV) paling minimum sebesar 1696251. Terdapat 6 variabel prediktor yang berpengaruh signifikan terhadap jumlah penderita penyakit tuberkulosis.

Kata Kunci: Regresi Nonparametrik, Multivariate Adaptive Regression Spline, Tuberkulosis


Keywords


Regresi Nonparametrik, Multivariate Adaptive Regression Spline, Tuberkulosis

Full Text:

PDF

References


[BPS] Badan Pusat Statistika. (2019). Statistik Kesejahteraan Rakyat Provinsi Jawa Barat 2019. Jawa Barat: Badan Pusat Statistika Jawa Barat.

[BPS] Badan Pusat Statistika. (2019). Statistik Kesejahteraan Rakyat Provinsi Jawa Tengah 2019. Jawa Tengah: Badan Pusat Statistika Jawa Tengah.

[BPS] Badan Pusat Statistika. (2019). Statistik Kesejahteraan Rakyat Provinsi Jawa Timur 2019. Jawa Timur: Badan Pusat Statistika Jawa Timur.

Dinas Kesehatan Provinsi Jawa Barat. (2019). Profil Kesehatan Provinsi Jawa Barat 2019. Jawa Barat.

Dinas Kesehatan Provinsi Jawa Timur. (2019). Profil Kesehatan Provinsi Jawa Timur 2019. Jawa Timur.

Dinas Kesehatan Provinsi Jawa Tengah. (2019). Profil Kesehatan Provinsi Jawa Tengah 2019. Jawa Tengah.

Eubank, R. L. (1998). Nonparametric Regression and Spline Smothing, second edition. New York: Marcel Dekker.

Friedman, J. (1991). Multivariate Adaptive Regression Spline. The Analysis of Statistics, 19(1), 1-141.

Kemenkes RI. (2019). Profil Kesehatan Indonesia 2019. Jakarta.

Knafl, G., & Ding, K. (2016). Adapitive Regression for Modeling Nonlinier Relatonships. Switzerland (CHE): Springer.

Nash, M. S., & Bradford, D. F. (2001). Parametric and Non Parametric Logistic Regression for Prediction of Precense Absence of an Amphibian. Las Vegas: Nevada.

Rachmasari, R., & Karyana, Y. (2020). Pemodelan Regresi Nonparametrik Spline Truncated Untuk Mengetahui Faktor-Faktor yang Mempengaruhi Penggunaan Konstrasepsi. 128-134.

WHO. (2020). Global Tuberculosis Report 2020. Switzerland.

Utama Muhammad Bangkit Riksa, Hajarisman Nusar. (2021). Metode Pemilihan Variabel pada Model Regresi Poisson Menggunakan Metode Nordberg. Jurnal Riset Statistika, 1(1), 35-42.




DOI: http://dx.doi.org/10.29313/.v0i0.29811

Flag Counter