KLUSTERISASI GENDER MENGGUNAKAN ALGORITMA K-MEANS GENDER CLUSTERING WITH K-MEANS ALGORITHM
Abstract
ABSTRAK
Penelitian di bidang Data Mining sangat penting bagi pengembangan pengetahuan bidang mechine learning, dimana salah satu bagiannya adalah pengelompokan/klusterisasi terhadap suatu data set untuk memperoleh informasi penting dari data set tersebut. Penelitian ini bertujuan menghasilkan pola pengelompokan/kluster dari data set gender berdasarkan data set nama-nama manusia yang diambil dari data set pada UCI_ML (UCI Machine Learning) tahun 2020 yang berjumlah 147.268 data. Data set ini akan dikelompokkan menjadi 2 kluster gender yaitu Male dan Female menggunakan algoritma K-Means. Hasil penelitian ini menunjukan bahwa dari keseluruhan data yang digunakan, terdapat 61% (89840) Female dan 39% (57428) Male.
Kata Kunci : Klasterisasi, Gender, Algoritma K Means
ABSTRACT
Research in the field of Data Mining is very important for the knowledge development in the field of machine learning, where one of the parts is clustering a data set to obtain important information from a data set. This study aims to produce a pattern of clusters from the gender data set based on the data set of human names taken from the data set in UCI_ML (UCI Machine Learning) in 2020 which amounted to 147,268 data. This data set is grouped into 2 gender clusters, namely Male and Female using the K-Means algorithm. The results of this study indicate that from the overall data used, there are 61% (89840) Female and 39% (57428) Male.
Keywords: Clustering, Gender, K Means Algorithm