Penerapan Distribusi Dirichlet Multinomial untuk Mengatasi Masalah Overdispersi pada Data yang Berdistribusi Multinomial

Intan Wida Aisyah, Nusar Hajarisman

Abstract


Abstract. Discrete data is the type of data in the form of numbers obtained by numerating. Discrete data consists of binary data or two categories, more than two categories, and counts. One of the research data that has more than two categories is polycotomus data, then the data is declared to follow a multinomial distribution if it fulfills some basic assumptions as there is no correlation between response variables, the chances of success of an event are constant. In practice, violations of assumptions often occur. This is an indication of an overdispersion problem. Data can be stated as having overdispersion problems when Pearson's deviance or chi square values are more than 1. Based on this description, it is necessary to find an appropriate statistical method to be used in determining the estimated parameters in multinomial distributed data. Multinomial self-distribution is one way to overcome the overdispersion problem in multinomial data. Estimation of the multinomial Dirichlet distribution parameters is performed using the maximum likelihood method and the Fisher scoring iteration method. So that obtained parameter values for of 0,68391, of 0,25679, and  of 0,23505.

Keywords: Polychotomous Data, Multinomial Distribution, Overdispersion, Dirichlet Multinomial Distribustion

Abstrak. Data diskrit adalah data dalam bentuk angka atau bilangan yang diperoleh dengan cara membilang. Data diskrit terdiri dari data biner atau dua kategori, lebih dari dua kategori, dan cacahan. Salah satu data hasil penelitian yang mempunyai lebih dari dua kategori adalah data polikotomus, maka data tersebut dinyatakan mengikuti distribusi multinomial apabila memenuhi beberapa asumsi dasar yaitu tidak ada korelasi antar variabel respon, peluang sukses dari suatu kejadian adalah konstan. Pada praktiknya sering terjadi pelanggaran asumsi. Hal tersebut merupakan salah satu indikasi adanya masalah overdispersi. Data dapat dinyatakan mengalami masalah overdispersi ketika nilai devians atau chi kuadrat Pearson yang lebih dari 1. Berdasarkan uraian tersebut, maka perlu dicari suatu metode statistika yang tepat untuk dapat digunakan dalam menentukan taksiran parameter pada data berdistribusi multinomial. Disribusi dirichlet multinomial merupakan salah satu cara untuk mengatasi permasalahan overdispersi pada data multinomial. Penaksiran parameter distribusi Dirichlet multinomial dilakukan menggunakan metode kemungkinan maksimum dan metode iterasi Fisher scoring. Sehingga diperoleh nilai parameter untuk sebesar 0,68391, sebesar 0,25679, dan sebesar 0,23505.

Kata Kunci: Data polikotomus, Distribusi Multinomial, Overdispersi, Distribusi Dirichlet Multinomial.

Abstract. Discrete data is the type of data in the form of numbers obtained by numerating. Discrete data consists of binary data or two categories, more than two categories, and counts. One of the research data that has more than two categories is polycotomus data, then the data is declared to follow a multinomial distribution if it fulfills some basic assumptions as there is no correlation between response variables, the chances of success of an event are constant. In practice, violations of assumptions often occur. This is an indication of an overdispersion problem. Data can be stated as having overdispersion problems when Pearson's deviance or chi square values are more than 1. Based on this description, it is necessary to find an appropriate statistical method to be used in determining the estimated parameters in multinomial distributed data. Multinomial self-distribution is one way to overcome the overdispersion problem in multinomial data. Estimation of the multinomial Dirichlet distribution parameters is performed using the maximum likelihood method and the Fisher scoring iteration method. So that obtained parameter values for of 0,68391, of0,25679, and  of 0,23505.

Keywords: Polychotomous Data, Multinomial Distribution, Overdispersion, Dirichlet Multinomial Distribustion

Abstrak. Data diskrit adalah data dalam bentuk angka atau bilangan yang diperoleh dengan cara membilang. Data diskrit terdiri dari data biner atau dua kategori, lebih dari dua kategori, dan cacahan. Salah satu data hasil penelitian yang mempunyai lebih dari dua kategori adalah data polikotomus, maka data tersebut dinyatakan mengikuti distribusi multinomial apabila memenuhi beberapa asumsi dasar yaitu tidak ada korelasi antar variabel respon, peluang sukses dari suatu kejadian adalah konstan. Pada praktiknya sering terjadi pelanggaran asumsi. Hal tersebut merupakan salah satu indikasi adanya masalah overdispersi. Data dapat dinyatakan mengalami masalah overdispersi ketika nilai devians atau chi kuadrat Pearson yang lebih dari 1. Berdasarkan uraian tersebut, maka perlu dicari suatu metode statistika yang tepat untuk dapat digunakan dalam menentukan taksiran parameter pada data berdistribusi multinomial. Disribusi dirichlet multinomial merupakan salah satu cara untuk mengatasi permasalahan overdispersi pada data multinomial. Penaksiran parameter distribusi Dirichlet multinomial dilakukan menggunakan metode kemungkinan maksimum dan metode iterasi Fisher scoring. Sehingga diperoleh nilai parameter untuk sebesar 0,68391, sebesar 0,25679, dan sebesar 0,23505.

Kata Kunci: Data polikotomus, Distribusi Multinomial, Overdispersi, Distribusi Dirichlet Multinomial.


Keywords


Data polikotomus, Distribusi Multinomial, Overdispersi, Distribusi Dirichlet Multinomial

References


Dajan, Anto. (1995). Pengantar Metode Statistik Jilid I. Jakarta: LP3S.

McCullagh, P., and J.A. Nelder. (1989). Generalized Linear Models. (Second Edition). New York: Chapman and Hall. Wilson.

Mosimann, James E. 1962. “On the Compound Multinomial Distribution, the Multivariate β-distribution, and Correlations among Proportions.†Biometrika, 49, 65–82.




DOI: http://dx.doi.org/10.29313/.v0i0.19723

Flag Counter     Â