Penerapan Algoritma K-Nearest Neighbor untuk Klasifikasi Nasabah Kartu Kredit

Mubasyirah Sultana, Siti Sunendiari

Abstract


Abstract. Credit facilities provided by banks are the biggest assets for banks. One of its main purpose is to make a profit. But there are things that can harm banks, namely bad credit. Non-performing loans often occur as a result of less stringent credit approval analysis. One algorithm that can be used for lending decisions is the k-Nearest Neighbor (k-NN) algorithm. This thesis discusses how to apply the k-NN algorithm for the classification of credit card client. The k-NN algorithm is a data classification technique in data mining. This algorithm classifies new objects based on training data by measuring their proximity. The data used is the default dataset of credit card clients of the Taiwan Bank dataset in 2005. The classification system is evaluated using a confusion matrix and produces the highest accuracy when k = 11, namely 76.43% and based on the ROC curve produces an AUC value of 78.665% which shows the quality of the classifier is enough.

Keywords: bad credit, data mining classification, k-Nearest Neighbor (k-NN), confusion matrix, ROC curve.

Abstrak. Fasilitas kredit yang diberikan oleh bank merupakan aset terbesar bagi bank. Salah satu tujuan utamanya adalah untuk mendapatkan keuntungan. Namun ada hal yang dapat merugikan bank yakni kredit macet. Kredit macet banyak terjadi sebagai akibat dari analisis pemberian persetujuan kredit yang tidak begitu ketat. Salah satu algoritma yang dapat digunakan untuk keputusan pemberian kredit adalah algoritma k-Nearest Neighbor (k-NN). Makalah ini membahas tentang cara menerapkan algoritma k-Nearest Neighbor untuk klasifikasi nasabah kartu kredit bank. Algoritma k-Nearest Neighbor merupakan teknik pengklasifikasian data dalam data mining. Algoritma ini melakukan klasifikasi dengan mengklasifikasikan objek baru berdasarkan data training dengan mengukur kedekatannya. Data yang digunakan dalam makalah ini merupakan dataset default of credit card clients dataset Taiwan Bank tahun 2005. Sistem klasifikasi dievaluasi atau diuji kehandalannya menggunakan confusion matrix dan menghasilkan akurasi tertinggi ketika k=11 yaitu 76,43% dan berdasarkan kurva ROC (Receiver Operating Characteristic) menghasilkan nilai AUC (Area Under Curve) sebesar 78,665% yang menunjukan kualitas classifier cukup.

Kata Kunci: kredit macet, klasifikasi data mining, k-Nearest Neighbor (k-NN), confusion matrix, kurva ROC

Keywords


kredit macet, klasifikasi data mining, k-Nearest Neighbor (k-NN), confusion matrix, kurva ROC

References


Berry. M.J.A. and Linoff, G.S (1997) Data mining techniques for marketing, sales, and customer support. John Wiley & Sons, Inc. Berstein

Gorunescu, F. 2011. Data mining: Concepts, Models, and Techniques. Verlag Berlin Heidelberg : Springer.

Han, J.,&Kamber, M. 2006. Data mining Concept and Tehniques. San Fransisco : Morgan Kauffman.

Kadarsah. 2010. Aplikasi ROC Untuk Uji Kehandalan Model HYBMG. Puslitbang BMKG.

Meilani, M. 2012. Pendekatan Indeks Antropometri Sebagai Alat Skreening Hipertensi Pada Orang Dewasa di Daerah Urban. Depok: Fakultas Kesehatan Masyarakat, Program Studi Pascasarjana Epidemiologi.

Prasetyo, E. 2012. Data Mining Konsep dan Aplikasi Menggunakan Matlab. Ed. Yogyakarta, Indonesia. Penerbit: ANDI.

Putra, Jan Wira Gotama. 2018. Pengenalan Konsep Pembelajaran Mesin dan Deep Learning. Edisi 1.2. Tokyo: Tokyo Institute of Technology.

Suyanto. 2019. Data Mining Untuk Klasifikasi dan Klasterisasi Data. Bandung: Informatika Bandung.

Suyatno, T. 2007. Kelembagaan Perbankan, Jakarta : PT. Gramedia Pustaka Utama.

Turban, E. 2005. Decision Support Systems and Intelligent Systems. Edisi Bahasa Indonesia Jilid 1. Andi: Yogyakarta.




Flag Counter