Penerapan Decision Tree Algoritma C5.0 dalam Mengklasifikasikan Keputusan Nasabah untuk Membuka Rekening Deposito Berjangka Berdasarkan Data Kegiatan Telemarketing Bank XYZ di Portugis

Hana Siti Azizah, Siti Sunendiari

Abstract


Abstract. Marketing becomes an important element for every company as a support in achieving it’s goals. This day, many companies realize that data generated from a marketing activity can be reprocessed to obtained useful information. One method of analysis that can dig up information on a set of data is data mining. In this paper the application of the data mining analysis method is carried out to produce a model in order to classify the customer's decision to open a deposit account offered by XYZ Bank in Portugal through telemarketing activities from the period May 2008 to November 2010. Specifically, the data mining technique used is a classification using the decision tree algorithm C5.0 and processed using IBM SPSS Modeler 18 software. From the modeling that has been done, it is obtained that the decision tree model produces 52 decisions in which the outcome variable (the customer's buying decision during the previous marketing activity) becomes the root node. The accuracy value of the model in the training dataset is 87.22% while in the data testing dataset is 86.61%. With the difference in accuracy of the training datatet and testing dataset is almost the same that is equal to 0.61%, it can be said that the decision tree formed well.

Keywords: C5.0 Algorithm, Data Mining, Decision Tree, IBM SPSS Modeler, Telemarketing.

Abstrak. Pemasaran menjadi elemen yang penting bagi setiap perusahaan sebagai penunjang dalam mencapai tujuannya. Banyak perusahaan menyadari bahwa data yang dihasilkan dari sebuah kegiatan pemasaran dapat diolah kembali sehingga diperoleh kumpulan informasi yang berguna. Salah satu metode analisis yang dapat menggali informasi pada sekumpulan data adalah data mining. Dalam makalah ini penerapan metode analisis data mining dilakukan untuk menghasilkan sebuah model dalam rangka mengklasifikasikan keputusan nasabah dalam membuka rekening deposito yang ditawarkan oleh Bank XYZ di Portugis melalui kegiatan telemarketing pada periode bulan Mei 2008 hingga bulan November 2010. Secara spesifik, teknik data mining yang digunakan adalah klasifikasi menggunakan decision tree algoritma C5.0 dan diolah menggunakan software IBM SPSS Modeler 18. Dari pemodelan yang telah dilakukan diperoleh hasil bahwa model decision tree menghasilkan 52 keputusan di mana variable poutcome (keputusan beli nasabah pada saat kegiatan marketing sebelumnya) menjadi akar atau root node. Nilai akurasi model yang didapat pada training datatset sebesar 87,22% sedangkan pada data testing dataset didapat 86.61%. Dengan selisih tingkat akurasi training datatset dan testing dataset hampir sama yaitu sebesar 0,61% maka decision tree yang terbentuk dapat dikatakan sudah baik.

Keywords: Algoritma C5.0, Data Mining, Decision Tree, IBM SPSS Modeler, Telemarketing.


Keywords


Algoritma C5.0, Data Mining, Decision Tree, IBM SPSS Modeler, Telemarketing

References


Andriani, A. 2012. Penerapan Algoritma C4. 5 Pada Program Klasifikasi Mahasiswa Dropout. In: Seminar Nasional Matematika (pp. 139-147).

Eko, S., & Nugroho, S. T. 2013. Rancang Bangun Website E-Commerce Berdasarkan Data Transaksional Dengan Knowledge Discovery in Databases (KDD). Bandung: Informatika.

Guo, J., dkk. 2018. Application of Birth Defect Prediction Model Based on C5.0 Decision Tree Algorithm. China: 2018 IEEE International Conference on Internet of Things (iThings) and IEEE Green Computing and Communications (GreenCom) and IEEE Cyber, Physical and Social Computing (CPSCom) and IEEE Smart Data (SmartData) (pp. 1867-1871)

IBM SPSS Modeler. Overview (Online). (https://www.ibm.com/id-en/marketplace/spss-modeler diakses pada tanggal 14 November 2019).

Indriani, A. 2014. Klasifikasi data forum dengan menggunakan metode naïve bayes classifier. In: Jurnal Fakultas Hukum UII.

Kusrini, E. T. L. 2009. Algoritma data mining. Yogyakarta: Andi Offset.

Kotler, Philip dan Gary Armstrong. 2012. Principles of Marketing. 14th. New Jersey: Pearson Education.

Lantz, B. (2013). Machine learning with R. India: Packt Publishing Ltd.

Larose. 2005. Discovering Knowledge in Data. New Jersey: John Willey & Sons, Inc.

Stanton, William J. 2000. Dasar-Dasar Pemasaran Edisi Ke Tujuh. Jakarta: Erlangga

Yunindya, Rifani. 2017. Model credit Scoring Menggunakan Metode Classification and Regression Trees (CART) pada Data Kartu Kredit. Skripsi Prodi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung.




Flag Counter