Klasifikasi Predikat Kelulusan Mahasiswa Unisba dengan Teknik Decision Tree J48 pada Data Mining

Helmy Hanifah, Siti Sunendiari

Abstract


Abstract. Today's technology, developments for large-scale data can be processed and can provide information quickly and accurately. An effective way to provide information is the data mining process. Data mining technique is a decision tree which is a data tree structure as a model in the process of determining the class of data. According to Cruz (2019), one of the decision tree techniques is J48 Decision Tree technique which is an implementation by the WEKA team from the famous decision tree training algorithm, C4.5. The advantage of the decision tree classification model is that it is easy to understand and identify, and has an accuracy comparable to other classification models. By applying the Decision Tree J48 technique, in making a decision seen at the highest Gain Ratio value. In large-scale data, it will be easier to find a decision with the Decision Tree J48 technique, for example large-scale data in the field of education. This study discusses how to model and look for accuracy values in the graduation data of Unisba's undergraduate students from 2013 to 2015 with the Decision Tree J48 technique. The results of the classification model of the six variables, which influence the GPA, SKS, and Regional Origin variables. The number of decisions formed as many as 7 decisions. The accuracy of the classification tree in the training data is 97.7 percent, in the testing data is 95.6 percent, and the ROC curve is included in the very good classification criteria.

Keywords: Data Mining, Decision Tree, Decision Tree J48, WEKA.

Abstrak. Teknologi masa kini, perkembangan untuk data yang berskala besar dapat diolah dan dapat memberikan informasi cepat dan akurat. Cara efektif untuk memberikan informasi yaitu dengan proses data mining. Teknik data mining yaitu decision tree yang merupakan struktur data pohon sebagai model dalam proses penentuan kelas dari suatu data. Menurut Cruz (2019), teknik decision tree salah satunya teknik Decision Tree J48 yang merupakan implementasi oleh tim WEKA dari pelatihan decision tree algoritma terkenal yaitu C4.5. Keuntungan model klasifikasi decision tree mudah dipahami dan diidentifikasi, memiliki akurasi yang sebanding dengan model klasifikasi lainnya. Dengan menerapkan teknik Decision Tree J48, dalam mengambil suatu keputusan dilihat pada nilai Gain Ratio tertinggi. Pada data berskala besar akan lebih mudah untuk mencari suatu keputusan dengan teknik Decision Tree J48, contoh data berskala besar yaitu di bidang pendidikan. Skripsi ini membahas cara memodelkan dan mencari nilai akurasi pada data kelulusan mahasiswa S1 Unisba angkatan 2013 sampai dengan angkatan 2015 dengan teknik Decision Tree J48. Hasil model pengklasifikasian dari keenam variabel, yang mempengaruhi yaitu variabel IPK, SKS, dan Asal Daerah. Terbentuk jumlah keputusan sebanyak 7 keputusan. Akurasi pohon klasifikasi pada data training sebesar 97.7 persen, pada data testing 95.6 persen, dan dengan kurva ROC termasuk ke dalam kriteria klasifikasi sangat baik.

Kata Kunci: Penambangan Data, Pohon Keputusan, Pohon Keputusan J48, WEKA.



Keywords


Penambangan Data, Pohon Keputusan, Pohon Keputusan J48, WEKA

References


Adinugroho, Sigit dan Yunita Arum Sari. 2018. Implementasi Data Mining Menggunakan WEKA. Malang: UB Press.

Cruz, Arnold P. Dela, dan Gilbert M. Tumibay. 2019. Predicting Tuberculosis Trearment Relapse: A Decision tree Analysis of J48 for Data mining. Filipina: Jurnal Komputer dan Komunikasi Volume 7 Nomor 243-251.

Fajrila, Erene. 2018. Perbandingan Klasifikasi Ketepatan Waktu Kelulusan Mahasiswa Menggunakan Regresi Logistik Biner dan Naive Bayes Classifier. Skripsi Prodi Statistika Fakultas MIPA Universitas Islam Indonesia.

Gorunescu, Florin. 2011. Data Mining Concepts, Models and Techniques. Berlin: Springer.

Han, J., dan Kamber M. 2006. Data mining Concepts and Techniques. San Fransisco: Morgan Kaufman.

Indriyani, Novi. 2009. Penerapan Metode Keputusan dengan Algoritma C4.5 pada sistem Penunjang Keputusan dalam Memprakirakan Cuaca Jangka Pendek. Skripsi Prodi Ilmu Komunikasi Fakultas Ilmu Komputer Universitas Indonesia.

Iskandar, D., dan Yoyon K. S. 2014. Perbandingan Akurasi Klasifikasi Tingkat Kemiskinanantara Algoritma C 4.5 dan Naïve Bayes. Jurnal Ilmiah Nero. (Online). (https://academia.edu, diakses 13 Desember 2019).

Larose, Daniel T. 2005. Discovering Knowledge In Data (An Introduction to Data mining). USA: Wiley.

Quinlan, J. Ross. 1993. C4.5: Programs for Machine Learning. California: Morgan Kauffman Publiher.

Undang-Undang Republik Indonesia Nomor 12. (2012). Tentang Pendidikan Tinggi. (Online). (https://sumberdaya.risetdikti.go.id, diakses 13 Desember 2019).

Yunindya, Rifani. 2017. Model credit Scoring Menggunakan Metode Classification and Regression Trees (CART) pada Data Kartu Kredit. Skripsi Prodi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung.




DOI: http://dx.doi.org/10.29313/.v0i0.19704

Flag Counter     Â