Pemodelan Data Besar Klaim Menggunakan Model Generalized Pareto Distribution
Abstract
Abstract. Claims size modeling is a way to predict the claim size that can be used to estimate the pricing of insurance premiums in the future. Peaks-Over-Threshold (POT) is a method that can be used for extreme claim big data, where one of the distributions in the POT method is the generalized Pareto distribution (GPD). The focus of this research is the claim size modeling using the generalized Pareto distribution (GPD) model. The data modeling procedures using the GPD model are: (1) matching distribution with existing distribution in eassyfit 5.5 software, (2) determining the limits on the big data claims using the heuristic method, (3) estimating the distribution parameters of the GPD model using the 5.5 easyfit software, (4) distribution fit test using the Kolmogorov-Smirnov test. As an application material, secondary data obtained from the insurance company PT. X 2014, the data contains big data on claims for Partial Loss of Category 5 motor vehicle insurance policy holders (vehicle prices are more than Rp. 800,000,000) Region 3 (other than Region 1 and Region 2) in Indonesia. The calculation results show that the big data for motor vehicle insurance claims for Category 5 Region 3 in Indonesia follows the GPD model.
Keywords: Generalized Pareto Distribution, Heuristik Method, Kolmogorov-Smirnov Test.
Abstrak. Pemodelan besar klaim merupakan cara untuk memprediksi besar klaim yang dapat digunakan untuk memperkirakan penetapan harga premi asuransi di masa datang. Peaks-Over-Threshold (POT) adalah salah satu metode yang dapat digunakan untuk data besar klaim yang ekstrim, yang mana salah satu distribusi dalam metode POT adalah generalized Pareto distribution (GPD). Fokus pada penelitian ini adalah pemodelan besar klaim menggunakan model generalized Pareto distribution (GPD). Prosedur pemodelan data menggunakan model GPD adalah: (1) mencocokan distribusi dengan distribusi yang ada pada software eassyfit 5.5, (2) menentukan batas (thereshold) pada data besar klaim menggunakan metode heuristik, (3) menaksir parameter distribusi model GPD menggunakan bantuan software eassyfit 5.5, (4) uji kecocokan distribusi menggunakan uji Kolmogorov-Smirnov. Sebagai bahan aplikasi akan digunakan data sekunder yang diperoleh dari perusahaan asuransi PT. X tahun 2014, data tersebut berisi data besar klaim Partial Loss pemegang polis asuransi kendaraan bermotor Kategori 5 (harga kendaraan lebih dari Rp. 800.000.000) Wilayah 3 (selain Wilayah 1 dan Wilayah 2) di Indonesia. Hasil perhitungan menunjukan bahwa data besar klaim asuransi kendaraan bermotor Kategori 5 Wilayah 3 di Indonesia mengikuti model GPD.
Kata Kunci: Generalized Pareto Distribution, Metode Heuristik, Uji Kolmogorov-Smirnov.
Keywords
Full Text:
PDFReferences
Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incomplete. Journal of the Royal Statistical Society, Series B 39.
Klugman, S. A., Panjer, H. H., & Willmot, G. A. (2008). Loss Models. Canada: Edisi Ketiga. Jhon Wiley and Sons, Inc.
Law, A. M., & Kelton, W. D. (1991). Simulation Modeling and Analysis. New York: Edisi kedua. McGraw-Hills, Inc.
Leadbetter, M. R. (1990). On a basis for "peaks over thereshold" modeling. Center for Stochastic Processes, 1-10.
Lee, D., Li, W. K., & Wong, T. S. (2012). Modeling insurance claims via a mixture exponential model combined with peaks-over-thereshold approach. Insurance: Mathematics and Economics, 538-550.
Pickands, J. (1975). Statistical inference using extreme order statistics. Annals of Statistics 3, 119–131.
Safitri, R.P., & Mutaqin, A. K. (2020). Pemodelan Besar Klaim Asuransi Kendaraan Bermotor Indonesia Menggunakan Model Komposit Log-Logistik – Generalized Pareto Distribution. Statistika, 1-27.
Yulianto Anggi Priliani, Darwis Sutawanir. (2021). Penerapan Metode K-Nearest Neighbors (kNN) pada Bearing. Jurnal Riset Statistika, 1(1), 10-18.
DOI: http://dx.doi.org/10.29313/.v0i0.30866
   Â