Penerapan Distribusi Random-Clumped Multinomial untuk Mengatasi Masalah Overdispersi pada Data yang Berdistribusi Multinomial

Rizka Adzkia Handoyo, Nusar Hajarisman

Abstract


Abstract. Discrete data is the type of the data in the form of numbers obtained by counting. Discrete data numbers include polycotomus, which has more than two categories. The number of events with more than two categories can be expressed by following a multinomial distribution. There are several basic assumptions that must be fulfilled when applying multinomial distributed models to certain data groups. Some of the assumptions are that the response variable is a random variable that is mutually independent and the chances of success of an event are constant. But in practice it is not uncommon for assumptions to occur, where there are liability between random variables. liability between random variables is interpreted as a correlation between response variables, it is an indication that there is a problem called overdispersion. Data can be stated as having an overdispersion problem when the Pearson deviation value or chi square is more than one. Multinomial random-clumped distribution is one method that can be used to overcome the overdispersion problem in data that follows multinomial distribution. The data used for this study is primary data obtained through the survey of PDAM user satisfaction levels in Antapani Wetan Village in 2019, there are 96 data used for analysis. After analysis, the following values are obtained  is 0.6872,  is 0.25879, and Ï is 0.24515. Because the value of Ï is significant, the data contains overdispersion.

Keywords: Polycotomus Data, Multinomial Distribution, Overdispersion, Random-Clumped Multinomial

Abstrak. Data diskrit merupakan data dalam bentuk angka (bilangan) yang diperoleh dengan cara membilang. Bilangan data diskrit diantaranya polikotomus, yaitu mempunyai lebih dari dua kategorik. Banyaknya kejadian dengan lebih dua kategorik dapat dinyatakan dengan mengikuti distribusi multinomial. Ada beberapa asumsi dasar yang harus dipenuhi pada saat mengaplikasikan model yang berdistribusi multinomial pada gugus data tertentu. Beberapa asumsi itu salah satunya adalah bahwa variabel respon merupakan variabel acak yang saling bebas, dan peluang sukses dari suatu kejadian adalah konstan. Namun pada praktiknya tak jarang terjadi pelanggaran asumsi, di mana terdapat ketidak bebasan antar variabel acak. Ketidak bebasan antar variabel acak dimaknai sebagai adanya korelasi diantara variabel respon, hal tersebut merupakan suatu bukti indikasi bahwa terdapat masalah yang disebut overdispersi. Data dapat dinyatakan mengalami masalah overdispersi ketika nilai devians atau chi kuadrat Pearson yang lebih dari satu. Distribusi random-clumped multinomial merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi multinomial. Data yang digunakan untuk penelitian ini merupakan data primer yang diperoleh melalui survei tingkat kepuasan pengguna PDAM di Kelurahan Antapani Wetan Tahun 2019, ada 96 data yang digunakan untuk analisis. Setelah dilakukan analisis maka diperoleh nilai-nilai sebagai berikut nilai sebesar 0,6872, sebesar 0,25879, dan  sebesar 0,24515. Karena nilai  signifikan maka data tersebut mengandung overdispersi.

Kata Kunci: Data Polikotomus, Distribusi Multinomial, Overdispersi, Random-Clumped Multinomial


Keywords


Data Polikotomus, Distribusi Multinomial, Overdispersi, Random-Clumped Multinomial

References


McCullagh, P., and J.A. Nelder (1989). Generalized Linear Models. (Second)

Morel,Jorge G., and Neerchal, Nagaraj K. (1993). A Finite Mixture Distribution

for Modelling Multinomial Extra Variation. Biometrika, 80, 363-371.

Neerchal, Nagaraj K., and Morel, Jorge G. (1998). Large cluster results for two parametric multinomial extra variation models. Journal of the American Statistical Association, 93, 1078–1087.




DOI: http://dx.doi.org/10.29313/.v0i0.19719

Flag Counter     Â