Penerapan Decision Tree Aloritma Iterative Dichotomiser 3 (ID3) pada Data Mining untuk Mengklasifikasikan Diagnosa Diabetes Mellitus

Melly Mustikasari, Teti Sofia Yanti

Abstract


Abstract. Data mining is an activity to find interesting patterns from a large amount of data, this data can be stored in a database, data warehouse, or other information storage. Data mining can be classified as a method decision tree. One of the algorithms used in the decision tree is the Iterative Dichotomiser 3 (ID3) algorithm. ID3 is a mathematical algorithm that is used to produce a decision tree capable of classifying an object, which is based on the calculation of the value entropy and Information Gain. The ID3 algorithm is used to classify diagnoses of  diabetes mellitus where data is taken from the dataset Pima Indian Diabetes Data from the  Uci Machine Learning Repository. The result of classification using the ID3 algorithm is that the attribute is glucose used as the root node and produces 157 rules. The classification tree accuracy in data testing using confusion matrix is 74.48%. The level of accuracy in the data testing shows that the classification of the trees formed is quite good.

Keywords: Data Mining,  Algoritma  Iterative Dichotomiser 3(ID3), Diabetes  Mellitus, Decision Tree, Entropy, Information Gain


Abstrak. Data mining adalah suatu kegiatan menemukan pola yang menarik dari suatu data yang mempunyai jumlah yang besar, data tersebut dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Pengklasifikasian dalam data mining dapat digunakan metode decision tree. Salah satu algoritma yang digunakan dalam decision tree adalah algoritma Iterative Dichotomiser 3 (ID3). ID3 merupakan suatu algoritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasikan suatu objek, yang didasarkan pada perhitungan nilai entropy dan Information Gain. Algoritma ID3 digunakan untuk mengklasifikasikan diagnosa  diabetes mellitus dimana data diambil dari dataset Pima Indian Diabetes Data dari  Uci Machine Learning Repository. Hasil dari pengklasifikasian menggunakan algoritma ID3 yaitu atribut glucose dijadikan sebagai root node dan menghasilkan sebanyak 157 rules keputusan. Akurasi pohon klasifikasi pada data testing menggunakan confusion matrix sebesar 74,48%. Tingkat akurasi pada data testing menunjukan bahwa klasifikasi pohon yang terbentuk sudah cukup baik.

Kata Kunci : Data Mining,  Algoritma  Iterative Dichotomiser 3(ID3), Diabetes  Mellitus, Decision Tree, Entropy, Information Gain


Keywords


Data Mining, Algoritma Iterative Dichotomiser 3(ID3), Diabetes Mellitus, Decision Tree, Entropy, Information Gain

References


ADA, A. D. (2012). Medical advise for people with diabetes in emergency situations. American Diabetes Association Journal.

Dhika, H., & Destiawati, F. (2017). Penerapan Algoritma C45 untuk Penilaian Karyawan pada Restoran Cepat Saji. Seminar Nasional Informatika dan Aplikasinya (SNIA), 55-59.

Larose, D. (2005). Discovering Knowledge in Data: An Introduction to Data Mining. Canada: Willey.

Tyasti, A. E., Ispriyanti, D., & Hoyyi, A. (2015). Algoritma Iterative Dichotomiser 3 (ID3) Untuk Mengidentifikasi Data Rekam Medis. Jurnal Gaussian, Volume 4, Nomor 2, 237-246.

Hanifah, H., & Sunendiari, S. (2020). Klasifikasi Predikat Kelulusan Mahasiswa Unisba Dengan Teknik Decision Tree J48 Pada Data Mining. Skripsi Prodi Statistika Fakultas MIPA Universitas Islam Bandung.

Lesmana, I. D. (2012). Perbandingan Kinerja Decision Tree J48 dan ID3 Dalam Pengklasifikasian Diagnosis Penyakit Diabetes Mellitus. Jurnal Teknologi dan Informatika Vol 2 No 2, 154-163

AlJarullah, A. A. (2011). Decision Tree Discovery for the Diagnosis of Type II Diabetes. International Conference on Innovations in Information Technology, 303-307




DOI: http://dx.doi.org/10.29313/.v6i2.24071

Flag Counter     Â