MODEL ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN STRATEGI PROMOSI UNIVERSITAS ISLAM NAHDLATUL ULAMA JEPARA
SKRIPSI
Diajukan sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Strata 1 (S.1) Program Studi Teknik Informatika Fakultas Sains dan Teknoogi Universitas Islam Nahdlatul Ulama Jepara
Oleh :
Damas Fahmi Assena NIM : 161240000500
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NAHDLATUL ULAMA (UNISNU) JEPARA 2020
PERSEMBAHAN
Dengan memanjatkan puji syukur kehadirat Allah Subhanahu Wa Ta’ala, karya ilmiah ini penulis persembahkan kepada: 1. Orangtua saya tercinta Bapak Asmudi Arva dan Ibu Kasniyati yang telah memberikan kasih sayang, perhatian, dan Do’a yang tak pernah putus. 2. Istri saya Rahma Nur Fadlila terima kasih atas kebersamaan dan dukungan untuk terus berjuang mengarungi kehidupan ini.
iv
MOTTO
“Dan Dia memberinya rezeki dari arah yang tidak disangka-sangkanya. Dan barang siapa bertawakal kepada Allah, niscaya Allah akan mencukupkan (keperluannya)nya. Sesungguhnya Allah melaksanakan urusan-Nya. Sungguh, Allah telah mengadakan ketentuan bagi setiap sesuatu”. (Qs. At-Talaq: 3)
“Dan apabila hamba-hamba-Ku bertanya kepadamu (muhammad) tentang Aku, maka sesungguhnya Aku adalah dekat. Aku mengabulkan permohonan orang yang berdo’a apabila ia memohon kepada-Ku. Hendaklah mereka itu memenuhi (perintah)-Ku dan beriman kepada-Ku, agar mereka memperoleh kebenaran”. (Qs. Al-Baqarah: 186)
“Baginya (manusia) ada malaikat-malaikat yang selalu menjaganya bergiliran, dari depan dan belakangnya. Dan mereka menjaganya atas perintah Allah. Sesungguhnya Allah tidak akan mengubah keadaan suatu kaum sebelum mereka mengubah keadaan diri mereka sendiri. Dan apabila Allah menghendaki keburukan terhadap suatu kaum, maka tidak ada yang dapat menolaknya dan tidak ada pelindung bagi mereka selain Dia”. (Qs. Ar-Ra’ad: 11)
“Dan milik Allah-lah kerajaan langit dan bumi; dan Allah maha kuasa atas segala sesuatu”. (Qs. Ali-Imron: 189)
v
KATA PENGANTAR
Segala puji syukur kehadirat Allah SWT atas limpahan rahmat, hidayah serta karunia yang tak terhingga kepada kita semua. Sholawat serta salam senantiasa kita haturkan kepada junjungan Nabi Agung Muhammad SAW sebagai uswatun hasanah yang telah membawa dunia dari jaman jahiliyyah menuju jaman islamiyyah. Pada kesempatan ini, penulis mengucapkan terima kasih sebesarbesarnya kepada semua pihak yang telah membantu penulis dalam menyelesaikan skripsi dengan judul “Model Algoritma K-Means Clustering Untuk Menentukan Strategi Promosi Universitas Islam Nahdlatul Ulama Jepara�. Untuk itu penulis mengucapkan terima kasih kepada: 1. Rektor Universitas Islam Nahdlatul Ulama Jepara 2. Bapak Ir. Gun Sudiryanto, M.M. selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Nahdlatul Ulama Jepara 3. Bapak Akhmad Khanif Zyen, M.Kom selaku Kaprodi Teknik Informatika Universitas Islam Nahdlatul Ulama Jepara 4. Bapak Harminto Mulyo, M.Kom selaku Dosen pembimbing I yang selalu bijaksana memberikan bimbingan, nasehat serta waktunya selama penulisan skripsi ini 5. Ibu Nur Aeni Widiastuti, S.Pd., M.Kom selaku Dosen Pembimbing II yang telah memberikan perhatian, bimbingan dan kepercayaan bagi penulis. 6. Bapak dan Ibu Dosen Program Studi Teknik Informatika khususnya dan Bapak serta Ibu Dosen di lingkungan Fakultas Sains dan Teknologi pada umumnya yang telah memberikan ilmu dan wawasan kepada penulis 7. Bapak Asmudi, Ibu Kasniyati, Istri Rahma Nur Fadlila yang selalu memberikan kasih sayang, do’a yang tak pernah putus, dan dukungan yang tiada henti kepada penulis 8. Teman seperjuangan program studi Teknik Informatika angkatan tahun 2016 9. Teman-teman mahasiswa dilingkungan Program Studi Teknik Informatika, Fakultas Sains dan Teknologi dan Unisnu Jepara yang senantiasa menghibur dan memberikan nasehat kepada penulis sehingga terselesainya karya ilmiah ini
vi
10. Semua Pihak yang telah membantu sehingga skripsi ini dapat terselesaikan dengan baik Semoga segala amal baik yang telah dilakukan mendapat ridho dan balasan pahala dari Allah SWT. Penulis menyadari bahwa dalam menyusun skripsi ini masih banyak sekali kekurangan dan masih jauh dari kata sempurna. Semoga skripsi ini bermanfaat bagi semua pihak. Amin.
Jepara, 17 September 2020 Penulis
Damas Fahmi Assena NIM. 161240000500
vii
ABSTRAK
Judul
Penulis NIM Prodi Pembimbing I Pembimbing II Penguji I Penguji II Tanggal Ujian
: MODEL ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN STRATEGI PROMOSI UNIVERSITAS ISLAM NAHDLATUL ULAMA JEPARA : Damas Fahmi Assena : 161240000500 : Teknik Informatika : Harminto Mulyo, M.Kom : Nur Aeni Widiastuti, S.Pd., M.Kom : Teguh Tamrin, M.Kom : Buang Budi Wahono, S.Si., M.Kom : 25 September 2020
Pada proses penerimaan mahasiswa baru Universitas Islam Nahdlatul Ulama Jepara akan menghasilkan data-data yang baru yang berlimpah berupa profil dari mahasiswa baru. Berdasarkan hal diatas informasi yang tersembunyi dapat diketahui dengan cara melakukan pengolahan terhadap data mahasiswa sehingga menghasilkan informasi yang bermanfaat bagi pihak universitas. Informasi yang didapatkan dapat membantu pihak universitas sebagai bahan pertimbangan dalam menentukan strategi promosi penerimaan mahasiswa baru di tahun depan. Penelitian ini betujuan untuk mengelompokan data mahasiswa kedalam sebuah cluster dengan menggunakan metode Data Mining algoritma K-Means Clustering. Data mahasiswa dikelompokan berdasarkan kemiripan data tersebut sehingga data dengan karakteristik yang sama akan berada dalam satu clutser. Atribut yang digunakan adalah kecamatan asal, asal sekolah, dan IPK (Indeks Prestasi Kumulatif) mahasiswa selama 2 semester awal. Cluster yang terbentuk setelah proses K-Means Clustering adalah tiga cluster dengan cluster pertama berjumlah 709 data mahasiswa, custer kedua 1116 data mahasiswa, dan cluster ketiga 2085 data mahasiswa. Cluster terbanyak berada pada cluster 3. Hasil dari penelitian ini digunakan sebagai salah satu dasar pengambilan keputusan untuk menentukan strategi promosi berdasarkan cluster yang terbentuk oleh pihak Universitas Islam Nahdlatul Ulama Jepara.
Kata Kunci : Kecamatan asal, asal sekolah, IPK (Indeks Prestasi Kumulatif), K-Means Clustering, Data Mining, Universitas Islam Nahdlatul Ulama Jepara
viii
ABSTRACT
Judul
Penulis NIM Prodi Pembimbing I Pembimbing II Penguji I Penguji II Tanggal Ujian
: MODEL ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN STRATEGI PROMOSI UNIVERSITAS ISLAM NAHDLATUL ULAMA JEPARA : Damas Fahmi Assena : 161240000500 : Teknik Informatika : Harminto Mulyo, M.Kom : Nur Aeni Widiastuti, S.Pd., M.Kom : Teguh Tamrin, M.Kom : Buang Budi Wahono, S.Si., M.Kom : 25 September 2020
In the process of admitting new students at the Nahdlatul Ulama Islamic University Jepara, new data will be abundant in the form of profiles from new students. Based on the information above, hidden information can be found by processing student data so as to produce useful information for the university. The information obtained can help the university as a consideration in determining the promotion strategy for new student admissions next year. This study aims to classify student data into a cluster using the Data Mining K-Means Clustering algorithm. Student data is grouped based on the similarity of the data so that data with the same characteristics will be in one cluster. The attributes used are the subdistrict of origin, the origin of the school, and the student's GPA (Grade Point Average) for the beginning of 2 semesters. The clusters formed after the K-Means Clustering process are three clusters with the first cluster totaling 709 student data, the second cluster 1116 student data, and the third cluster 2085 student data. The most clusters are in the third cluster. The results of this study are used as one of the basis for making decision to determine a promotion strategy based on the cluster formed by the Nahdlatul Ulama Islamic University Jepara.
Keywords
: Subdistrict of origin, school origin, GPA (Grade Point Average), K-Means Clustering, Data Mining, Nahdlatul Ulama Islamic University Jepara
ix
DAFTAR ISI
SAMPUL HALAMAN PERSETUJUAN PEMBIMBING ............................................................................ i PENGESAHAN SKRIPSI ...................................................................................... ii PERNYATAAN KEASLIAN ................................................................................ iii PERSEMBAHAN .................................................................................................. iv MOTTO .................................................................................................................. v KATA PENGANTAR ........................................................................................... vi ABSTRAK ........................................................................................................... viii ABSTRACT ............................................................................................................. ix DAFTAR ISI ........................................................................................................... x DAFTAR TABEL ................................................................................................ xiii DAFTAR GAMBAR ............................................................................................ xv DAFTAR LAMPIRAN ........................................................................................ xvi BAB I PENDAHULUAN .................................................................................... 1 1.1
Latar Belakang ......................................................................................... 1
1.2
Batasan Masalah ....................................................................................... 5
1.3
Rumusan Masalah .................................................................................... 5
1.4
Tujuan Penelitian...................................................................................... 6
1.5
Manfaat Penelitian .................................................................................... 6
1.6
Sistematika Penyusunan Skripsi............................................................... 7
BAB II LANDASAN TEORI ............................................................................... 8 2.1
Tinjauan Studi .......................................................................................... 8
2.2
Tinjauan Pustaka ...................................................................................... 9
x
Bussines Intelligence ......................................................................... 9 Pengertian Data Mining .................................................................. 10 Tahapan Data Mining ...................................................................... 12 Teknik-Teknik Data Mining ........................................................... 13 Metode Data Mining ....................................................................... 16 Clustering ........................................................................................ 18 Algoritma K-Means Clustering ....................................................... 19 Transformasi Data ........................................................................... 24 Pengolahan data .............................................................................. 25 Pengujian Hasil Clustering K-Means .............................................. 28 Metode Receiver Operating Characteristic (ROC) ......................... 29 2.3
Kerangka Pemikiran ............................................................................... 31
BAB III METODE PENELITIAN ....................................................................... 32 3.1
Desain Penelitian .................................................................................... 32
3.2
Pengumpulan Data ................................................................................. 32
3.3
Lokasi Penelitian .................................................................................... 33
3.4
Pengolahan Data ..................................................................................... 33
3.4.1
Perangkat Keras .............................................................................. 34
3.4.2
Perangkat Lunak.............................................................................. 34
3.5
Tahapan Metode ..................................................................................... 35
3.5.1
Pre-processing Data ........................................................................ 35
3.5.2
K-Means Clustering ........................................................................ 36
3.6
Evaluasi .................................................................................................. 41
3.6.1
Pengujian Metode BCV dan WCV ................................................. 42
3.6.2
Pengujian Metode ROC .................................................................. 43
xi
BAB IV HASIL PENELITIAN DAN PEMBAHASAN ...................................... 45 4.1
Pre-Processing Data ............................................................................... 45
4.1.1
Data Reduction ................................................................................ 46
4.1.2
Data Cleaning .................................................................................. 47
4.1.3
Data Transformation ....................................................................... 48
4.1.4
Data Integration ............................................................................... 52
4.2
Penerapan Algoritma K-Means Clustering ............................................ 53
4.3
Penerapan Algoritma menggunakan Microsoft Excel 2019 ................... 54
4.4
Evaluasi .................................................................................................. 63
4.4.1
Pengujian Metode BCV dan WCV ................................................. 63
4.4.2
Pengujian Metode ROC .................................................................. 64
4.5
Penerapan Algoritma menggunakan Rapidminer Studio ....................... 66
BAB V PENUTUP .............................................................................................. 73 5.1
Kesimpulan ............................................................................................. 73
5.2
Saran ....................................................................................................... 74
DAFTAR PUSTAKA ........................................................................................... 75 LAMPIRAN .......................................................................................................... 77
xii
DAFTAR TABEL
Table 2.1 Data Mahasiswa .................................................................................... 23 Table 2.2 Inisialisasi Data Wilayah Kota Asal ..................................................... 24 Table 2.3 Inisialisasi Data Jurusan ........................................................................ 24 Table 2.4 Titik Pusat Awal Setiap Cluster ............................................................ 26 Table 2.5 Contoh Hasil Perhitungan Setiap Data ke Setiap Cluster ..................... 27 Table 2.6 Kriteria Pengukuran Rasio .................................................................... 29 Table 2.7 Standar Receiver Operating Characteristic (ROC) ............................... 30 Table 3.1 Data Mahasiswa 2016 sampai 2018 ...................................................... 36 Table 3.2 Inisialisasi Data Kecamatan Asal .......................................................... 38 Table 3.3 Inisialisasi Data Asal Sekolah ............................................................... 38 Table 3.4 Titik Pusat Awal Setiap Cluster ............................................................ 39 Table 3.5 Contoh Hasil Perhitungan Setiap Data ke Setiap Cluster ..................... 40 Table 3.6 Nilai Centroid pada iterasi terakhir ....................................................... 42 Table 3.7 Nilai Centroid pada iterasi terakhir ....................................................... 44 Table 3.8 Standar Receiver Operating Characteristic (ROC) ............................... 44 Table 4.1 Inisialisasi Data Kecamatan Asal .......................................................... 50 Table 4.2 Inisialisasi Data Asal Sekolah ............................................................... 51 Table 4.3 Titik Pusat Awal Setiap Cluster ............................................................ 55 Table 4.4 Tabel Centroid Baru (Cluster 1)............................................................ 58 Table 4.5 Tabel Centroid Baru (Cluster 2)............................................................ 58 Table 4.6 Tabel Centroid Baru (Cluster 3)............................................................ 58 Table 4.7 Hasil Cluster 1 Penerapan Algoritma K-Means Clustering (Microsoft Excel)..................................................................................................................... 60 Table 4.8 Hasil Cluster 2 Penerapan Algoritma K-Means Clustering (Microsoft Excel)..................................................................................................................... 61 Table 4.9 Hasil Cluster 3 Penerapan Algoritma K-Means Clustering (Microsoft Excel)..................................................................................................................... 62 Table 4.10 Nilai Centroid pada iterasi terakhir ..................................................... 63 Table 4.11 Nilai Centroid pada iterasi terakhir ..................................................... 65
xiii
Table 4.12 Standar Receiver Operating Characteristic (ROC) ............................. 65 Table 4.13 Perbandingan Hasil Perhitungan ......................................................... 72
xiv
DAFTAR GAMBAR Grafik 1.1 Data Mahasiswa 2016-2018 .................................................................. 2
Gambar 2.1 Business Intelligence Environment [9] ............................................. 10 Gambar 2.2 Bidang Ilmu Data Mining [15] .......................................................... 11 Gambar 2.3 Tahapan Proses Knowledge Discovery in Database [14] ................. 11 Gambar 2.4 Bidang Ilmu Data Mining [15] .......................................................... 12 Gambar 2.5 Teknik Data Mining [16]................................................................... 14 Gambar 2.6 Clustering [17]................................................................................... 15 Gambar 4.1 Data Mentah Mahasiswa UNISNU Jepara ........................................ 45 Gambar 4.2 Tahapan Preprocessing Data ............................................................ 46 Gambar 4.3 Tahapan Data Reduction ................................................................... 47 Gambar 4.4 Proses Inisialisasi Data Kecamatan Asal di Microsoft Excel ............ 49 Gambar 4.5 Proses Inisialisasi Data Asal Sekolah di Microsoft Excel ................. 51 Gambar 4.6 Proses Data integration Mahasiswa UNISNU Jepara ...................... 53 Gambar 4.7 Menghitung Jarak Data Ke Setiap Cluster di Excel .......................... 56 Gambar 4.8 Mengalokasikan Data ke dalam Cluster di Excel.............................. 57 Gambar 4.9 Verifikasi Data Centroid (Microsoft Excel) ...................................... 59 Gambar 4.10 Proses Impor Dataset kedalam RapidMiner .................................... 67 Gambar 4.11 Desain Clustering Menggunakan Algoritma K-Means ................... 67 Gambar 4.12 Result History menggunakan Algoritma K-Means Clustering ....... 68 Gambar 4.13 Centroid Distance K-Means Clustering .......................................... 69 Gambar 4.14 Hasil Cluster Model K-Means......................................................... 69 Gambar 4.15 Hasil Perhitungan Antara Jarak cluster dengan centroid menggunakan Rapid Miner Studio ........................................................................ 70 Gambar 4.16 Hasil Set Clustering (Diagram Scatter) .......................................... 71
xv
DAFTAR LAMPIRAN
LAMPIRAN A Tabel IPK Semester 2 angkatan 2016 sampai 2018 .................... 77 LAMPIRAN B Tabel Dataset Mahasiswa ............................................................ 86 LAMPIRAN C Tabel Perhitungan Jarak Data ke Setiap Cluster (Ms. Excel) ..... 96 LAMPIRAN D Tabel Clustering Data Mahasiswa (Ms. Excel) ........................ 105
xvi
BAB I PENDAHULUAN
1.1
Latar Belakang Pendidikan merupakan salah satu aspek yang penting dalam pembangunan bangsa, keberhasilan pembangunan negara adalah dengan tersedianya penduduk yang terdidik dalam jumlah, jenis, dan tingkat yang memadai. Dengan pendidikan seseorang menjadi cerdas, memiliki kemampuan, sikap hidup yang lebih baik dan pada akhirnya dapat meningkatkan taraf hidupnya ke jenjang yang lebih tinggi. Untuk mencapai tujuan pendidikan yang terarah, diperlukan suatu lembaga pendidikan yang berjenjang dimulai dari pendidikan tingkat dasar, pendidikan menengah dan pendidikan tinggi [1]. Penyelenggaraan
pendidikan
tinggi
melalui
perguruan
tinggi
dimaksudkan untuk meningkatkan kemampuan akademik dan keahlian (profesional), siswa-siswi sekolah menengah (SMA, SMK, dan MA) dapat melanjutkan ke perguruan tinggi untuk meningkatkan kemampuan akademik dan keahlian mereka. UNISNU adalah sebuah perguruan tinggi di Indonesia yang merupakan penggabungan dari 3 perguruan tinggi yaitu STIENU, STTDNU dan INISNU. Dikelola oleh Yayasan Pendidikan Tinggi Nahdlatul Ulama (Yaptinu) Jepara berdiri sejak tahun 1989 yang terletak di Jepara, UNISNU memiliki 5 fakultas dan 19 program studi. Untuk masuk menjadi civitas akademika (warga) UNISNU, siswa-siswi sekolah menengah (SMA, SMK, dan MA) dapat mengikuti seleksi masuk yang diselenggarakan oleh Universitas Islam Nahdlatul Ulama Jepara. Seleksi masuk mahasiswa di UNISNU lebih dikenal dengan istilah Penerimaan Mahasiswa Baru (PMB), kegiatan PMB adalah salah satu kegiatan rutin tahunan sebagai media untuk merekrut calon mahasiswa baru
1
2
sesuai dengan kriteria yang ditetapkan oleh UNISNU dengan tujuan agar calon mahasiswa yang lulus seleksi atau diterima menjadi mahasiswa dapat menyelesaikan studi tepat waktu sesuai dengan program studi yang mereka tempuh. Grafik 1.1 Data Mahasiswa 2016-2018
Data Mahasiswa UNISNU 2016 - 2018 Jumlah Mahasiswa
1400 1350 1300 1250 1200 1150 1100 1050 2016
2017
2018
Tahun Berdasarkan data yang diperoleh dari bagian UPT Pusat Data dan Pengembangan IT UNISNU, pada tahun 2016 jumlah mahasiswa baru berjumlah 1165 mahasiswa, pada tahun 2017 berjumlah 1366 mahasiswa, dan pada tahun 2018 berjumlah 1379. Pada tahun 2016 hingga 2017 jumlah mahasiswa baru mengalami peningkatan sejumlah 201 mahasiswa. Pada tahun 2017 hingga 2018 jumlah mahasiswa baru mengalami peningkatan sejumlah 13 mahasiswa. Namun pada tahun 2018 peningkatan mahasiswa hanya sejumlah 13 mahasiswa lebih turun jika dibandingkan pada tahun 2017 berjumlah 201 mahasiswa. Dalam mengatasi permasalahan tersebut, peran Bisnis Intelligence (BI) dapat membantu mendapatkan pengetahuan yang jelas sehingga dapat membantu dalam pengambilan keputusan serta sekaligus meningkatkan keunggulannya (competitive advantage). Dengan kegiatan Bisnis Intelligence
3
(BI) tersebut maka sebuah organisasi atau perusahaan akan dengan mudah dalam mengambil keputusan secara cepat dan tepat [2]. Dalam penelitian ini Bisnis Intelligence (BI) digunakan untuk mengelompokan data mahasiswa dengan memanfaatkan proses data mining menggunakan metode smart clustering yaitu k-means. K-means merupakan salah
satu
metode
data
non-hierarchical
clustering
yang
dapat
mengelompokkan data mahasiswa ke dalam beberapa cluster berdasarkan kemiripan dari data tersebut, sehingga data mahasiswa yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik berbeda dikelompokkan dalam cluster yang lain. Menurut Shovon dan Haque (2012) telah menyelesaikan penelitian yang berjudul “An Approach of Improving Student’s Academik Performance by using K-Means Clustering Algorithm and Decision Tree”. Jurnal tersebut menguraikan bagaimana mengurangi rasio Drop Out yang signifikan dan meningkatkan kinerja siswa dalam bidang akademik. Tujuan dalam penelitian tersebut yaitu mempartisi mahasiswa-mahasiswa berdasarkan karakteristik yang sama menjadi kelompok-kelompok sesuai dengan karakteristik dan kemampuan mereka. Penelitian menggunakan proses data mining. Algoritma Clustering K-Means dan pohon keputusan untuk memprediksi kegiatan belajar mahasiswa [3]. Menurut Syazwani Rasid, N. dan Ahmad (2014) telah melakukan penelitian yang berjudul “Grouping Students Academic Performance Using One-Way Clustering”. Tujuan dari penelitian ini yaitu menerapkan algoritma Clustering K-Means yang berfungsi sebagai tolok ukur yang sangat baik untuk memantau perkembangan siswa dalam belajar di sekolah. Penelitian menggunakan metode hirarki dan K-Means untuk menentukan kelompok siswa. Hasil Clustering dibandingkan dan ditemukan bahwa K-Means adalah yang paling cocok dalam pengelompokkan prestasi akademik siswa [4]. Menurut Sugiharti dan Muslim (2016) telah menyelesaikan penelitian yang berjudul “On-Line Clustering of Lectures Performance of Computer
4
Science Department of Semarang State University Using K-Means Algorithm�. Penelitian tersebut menguraikan mengenai bagaimana cara merancang program pengembangan sistem dalam bentuk online dengan mengelompokkan kinerja dosen berdasarkan 3 tanggung jawab menggunakan Clustering [5]. Menurut Mardalius (2017) telah melakukan penelitian yang berjudul “Implementasi Algoritma K-Means Clustering Untuk Menentukan Kelas Kelompok Bimbingan Belajar Tambahan�. Tujuan dalam penelitian tersebut yaitu menentukan kelompok kelas belajar tambahan materi mata pelajaran. Penelitian menerapkan data mining dengan metode Clustering dengan algoritma K-Means. Algoritma K-Means Clustering dapat digunakan untuk mengelompokkan data siswa berdasarkan nilai ujian semester mata pelajaran Ujian Nasional, yaitu kemampuan siswa pintar, siswa sedang dan siswa kurang pintar. sehingga dapat mengetahui siswa yang mana saja yang akan diberi belajar tambahan agar dapat mencapai nilai standar kelulusan Ujian Nasional [6]. Dari beberapa referensi penelitian terdahulu yang mempunyai keterkaitan dengan metode dan objek penelitian, maka peneliti mengunakan metode algoritma K-Means Clustering. Atribut yang digunakan dalam menentukan pengelompokkan wilayah untuk melakukan promosi di UNISNU berdasarkan asal kecamatan, asal sekolah, dan IPK mahasiswa. Diharapkan penelitian dengan menerapkan metode k-means, mampu membantu kegiatan memberikan status mahasiswa kepada pelamar yang hendak menempuh studi (Admisi) untuk mengambil keputusan dalam menentukan wilayah promosi yang tepat sasaran dan mana yang menjadi prioritas wilayah dari mahasiswa terbanyak sehingga tidak terjadi penurunan jumlah mahasiswa pada tahun berikutnya dan juga untuk mendapatkan nilai akurasi dari kinerja metode k-means. Tujuan dari penelitian ini adalah menerapkan algoritma K-means Clustering pada data penerimaan mahasiswa baru tahun ajaran 2016 sampai
5
2018 dengan jumlah 3910 mahasiswa. Atribut yang dibutuhkan dalam pengolahan adalah kecamatan asal mahasiswa, asal sekolah mahasiswa, dan IPK mahasiswa.
1.2
Batasan Masalah Batasan-batasan masalah dalam penelitian ini antara lain: 1) Data yang digunakan adalah data mahasiswa Universitas Islam Nahdlatul Ulama angkatan 2016 sampai dengan angkatan 2018. 2) Algoritma yang digunakan adalah Algoritma K-Means Clustering. 3) Atribut atau parameter data yang digunakan adalah kecamatan asal mahasiswa, asal sekolah mahasiswa, dan IPK mahasiswa semester pertama dan kedua pada angkatan 2016 sampai dengan angkatan 2018.
1.3
Rumusan Masalah Rumusan Berdasarkan latar belakang di atas dapat dirumuskan permasalahan yang akan diselesaikan dalam penelitian ini adalah: 1) Bagaimana menerapkan metode Data Mining dengan algoritma K-Means Clustering untuk menentukan wilayah yang tepat untuk promosi Universitas Islam Nahdlatul Ulama Jepara. 2) Bagaimana sebaran wilayah berdasarkan data mahasiswa baru sesuai dengan indeks prestasi akademik mahasiswa? 3) Bagaimana prioritas wilayah yang tepat untuk cluster yang terbentuk?
6
1.4
Tujuan Penelitian Tujuan pada penyusunan penelitian ini adalah untuk mengetahui: 1) Menerapkan metode Data Mining dengan algoritma K-Means Clustering untuk menentukan wilayah yang tepat untuk promosi. 2) Mengetahui sebaran wilayah berdasarkan data mahasiswa angkatan 2016 sampai angkatan 2018. 3) Menentukan prioritas wilayah yang tepat untuk cluster yang terbentuk.
1.5
Manfaat Penelitian Diharapkan dari penelitian ini dapat memberikan manfaat sebagai berikut: 1) Bagi peneliti: a) Data mahasiswa yang berjumlah ribuan dapat cepat diproses dan dipisahkan berdasarkan kemiripan data dengan metode data mining menggunakan algoritma K-Means Clustering. b) Hasil penelitian ini dapat memberikan gambaran wilayah mana yang
berpontensi
berdasarkan
dalam
kecamatan
penerimaan asal
mahasiswa
mahasiswa,
asal
baru
sekolah
mahasiswa, dan IPK mahasiswa. 2) Bagi perguruan tinggi: a) Dapat digunakan sebagai pertimbangan untuk memaksimalkan wilayah mana yang di prioritaskan untuk dilakukannya promosi. b) Bagi Admisi dapat membantu sebagai bahan pertimbangan untuk menentukan langkah selanjutnya dalam penerimaan mahasiswa baru.
7
1.6
Sistematika Penyusunan Skripsi Sistematika Penulisan terdiri dari: 1) Bagian awal skripsi 2) Bagian pokok skripsi yang terdiri dari: a. Bab I
: Pendahuluan Pada bab ini diuraikan secara ringkas pembahasan tentang
Latar
Perumusan
Belakang,
Masalah,
Batasan
Maksud
dan
Masalah, Tujuan
Penelitian, Manfaat Penelitian, dan Sistematika Penulisan. b. Bab II
: Landasan Teori Di dalam bab ini dijelaskan tentang tinjauan pustaka dan landasan teori yang berhubungan dengan penelitian ini.
c. Bab III
: Metode Penelitian Bab ini berisikan tentang objek, rincian perangkat yang digunakan serta metode penelitian.
d. Bab IV
: Hasil Penelitian dan Pembahasan Pada bab ini sudah masuk pada tahap analisis penelitian dan pembahasan mengenai penerapan metode yang digunakan.
e. Bab V
: Penutup Di bab ini diuraikan kesimpulan dan saran dari hasil penelitian yang penulis peroleh.
3) Bagian akhir skripsi terdiri dari Daftar Pustaka dan Lampiran
BAB II LANDASAN TEORI
2.1
Tinjauan Studi Dalam penelitian yang dilakukan sebelumnya dengan judul Penerapan Data Mining Untuk Menentukan Strategi Promosi Universitas PGRI Yogyakarta Menggunakan Algoritma K-means Clustering. Penelitian ini melakukan strategi untuk promosi Universitas PGRI Yogyakarta dengan menggunakan K-means clustering agar mengetahui persebaran wilayah berdasarkan indeks prestasi mahasiswa. Dengan menerapkan metode algoritma K-Means Clustering menggunakan dua aplikasi yaitu Microsoft Excel 2019 dan Sistem Aplikasi K-Means Clustering [7]. Dalam Penelitian selanjutnya dengan judul Implementasi Data Mining Menggunakan Algoritma K-Means Clustering Untuk Mengetahui Pola Pemilihan 8 Program Studi IAIN Salatiga. Penelitian ini bertujuan untuk mencari pola pemilihan program studi yang akan dilakukan pada mahasiswa IAIN Salatiga. Dengan pengolahan data mining menggunakan algoritma kmeans clustering untuk mengetahui pola pemilihan progam studi IAIN Salatiga, dilakukan dengan menggunakan dua aplikasi, yang pertama dengan menggunakan aplikasi pengolah angka Microsoft Excel dan dengan menggunakan apalikasi yang peneliti rancang dengan menggunakan bahasa pemrograman PHP dan Database MySQL. Hasil dari proses k-means clustering dengan menggunakan data mahasiswa IAIN Salatiga S1 angkatan 2016 terbagi ke dalam lima cluster, dimana cluster pertama berisikan tentang program studi yang paling diminati oleh mahasiswa baru IAIN Salatiga, cluster kedua berisikan prodi dengan peminat lebih sedikit dengan dari cluster pertama dan lebih banyak di bandingkan dengan cluster tiga, empat dan lima, pada cluster tiga berisikan program studi yang diminati, sedangkan pada cluster empat dan lima berisikan program studi yang kurang diminati oleh mahasiswa baru [8].
8
9
2.2
Tinjauan Pustaka Dalam landasan teori ini akan dijelaskan secara garis besar teori-teori yang menjadi dasar atau acuan dalam penelitian ini:
Bussines Intelligence Business Intelligence (BI) adalah sebuah proses ekstraksi data operasional organisasi atau perusahaan, kemudian mengumpulkannya kedalam sebuah data warehouse. Sebuah data warehouse dirancang untuk mendukung sebuah proses lanjutan dalam rangka mendapatkan informasi berharga menggunakan teknik data mining. Konsep BI menekankan pada penerapan 5 pendayagunaan informasi untuk keperluan spesifik bisnis, masing-masing adalah sebagai berikut [1]: 1) Data sourcing. 2) Data analysis. 3) Situation awareness. 4) Risk analysis. 5) Decission support. Dalam membuat business modelling digunakan business model dan diagram yang memberikan informasi secara grafis bagi anggota suatu organisasi atau perusahaan memahami dan mengkomunikasikan business rule dan proses-proses bisnisnya [1].
10
Gambar 2.1 Business Intelligence Environment [9] Seorang kepala biro marketing, dia dapat melakukan kampanye pemasaran dengan segmentasi target yang jelas dan dapat diperhitungkan dalam menyumbang penerimaan mahasiswa baru bagi institusinya dengan mencari strategi yang tepat dalam melakukan promosi, dan masih banyak lagi evaluasi kinerja manajemen dari setiap divisi yang dilakukan pada suatu organisasi atau perusahaan.
Pengertian Data Mining Data mining adalah proses menganalisis data dan menemukan pola tersembunyi secara otomatis atau semi otomatis [10]. Pola atau hubungan digunakan sebagai alat untuk menjelaskan data dan memprediksi data yang baru [11]. Ada beberapa definisi lain dari data mining. Data mining adalah proses menganalisis data yang sangat besar untuk menemukan hubungan dan merepresentasikan data yang berguna dan dapat dipahami untuk pemiliknya [12]. Secara sederhana, data mining berarti menggali pengetahuan dari data yang berjumlah banyak [13]. Salah satu kesulitan mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah. Gambar 2.2 merupakan bidang ilmu yang menjadi akar panjang dari data mining. Beberapa bidang ilmu tersebut seperti kecerdasan
11
buatan, machine learning, statistik, database, dan juga information retrieval [14].
Gambar 2.2 Bidang Ilmu Data Mining [15] Data Mining terkadang dianggap sama dengan istilah KDD (Knowledge Discovery in Database). Namun, Data Mining adalah salah satu bagian dari KDD. Dibandingkan dengan KDD, Data Mining lebih dikenal di kalangan pelaku bisnis. Sebagai komponen dalam KDD, Data Mining berkaitan dengan ekstraksi dan perhitungan pola-pola yang telah dianalisis. Tahapan dalam proses KDD dijelaskan di bawah ini: [14]
Gambar 2.3 Tahapan Proses Knowledge Discovery in Database [14]
12
Tahapan Data Mining Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif di mana pemakai terlibat langsung atau dengan perantaraan knowledge base. Tahapan-tahapan tersebut, diantaranya ditunjukkan pada Gambar 2.3:
Gambar 2.4 Bidang Ilmu Data Mining [15] Serangkaian proses tahapan data mining tersebut memiliki tahap sebagai berikut : [13] 1) Data Cleaning Data cleaning merupakan proses menghilangkan noise, data yang tidak konsisten, dan data yang tidak relevan. 2) Data Integration Data integration merupakan proses menggabungkan data dari berbagai data sumber (data source) ke dalam database yang akan digunakan untuk proses penggalian data. 3) Data Selection
13
Data selection merupakan proses pemilihan data yang digunakan untuk proses penggalian data. 4) Data Transformation Data Transformation merupakan proses mentransformasikan dan mengkonsolidasikan data untuk digunakan dalam proses mining. 5) Data Mining Data mining merupakan proses utama mencari pengetahuan atau pola dari informasi tersembunyi dari database. 6) Pattern Evaluation Pattern Evaluation merupakan proses mengidentifikasi pola yang telah didapat.
7) Knowledge Presentation Knowledge Presentation merupakan visualisasi dan presentasi pengetahuan atau pola yang telah didapat kepada pengguna.
Teknik-Teknik Data Mining Menurut Ahmed, teknik data mining biasanya terbagi dalam dua kategori, prediksi dan deskripsi. Teknik prediksi menggunakan data historis untuk menyimpulkan sesuatu tentang kejadian di masa depan. Sedangkan teknik deskripsi bertujuan untuk menemukan pola dalam data yang menyediakan tersembunyi.
beberapa
informasi
tentang
hubungan
interval
yang
14
Gambar 2.5 Teknik Data Mining [16]
Menurut Kumar dan Saurabh, terdapat beberapa teknik yang digunakan dalam data mining, yaitu: [16] 1. Classification Klasifikasi adalah teknik yang paling umum diterapkan pada data mining. Pendekatan ini sering menggunakan keputusan pohon (decision tree) atau neural network berbasis algoritma klasifikasi. 2. Clustering Clustering bisa dikatakan sebagai identifikasi kelas objek yang memiliki kemiripan. Dengan menggunakan teknik clustering kita bisa lebih lanjut mengidentifikasi kepadatan dan jarak daerah dalam objek ruang dan dapat menemukan secara keseluruhan pola distribusi dan korelasi antara atribut.
15
Pendekatan klasifikasi secara efektif juga dapat digunakan untuk membedakan kelompok atau kelas objek. Metode ini digunakan untuk mengidentifikasi kelompok alami dari sebuah kasus yang didasarkan pada sebuah kelompok atribut, mengelompokkan data yang memiliki kemiripan atribut. Gambar 2.5 Clustering ini menunjukkan kelompok data pelanggan sederhana yang berisi dua atribut, yaitu Age (Umur) dan
Income
(Pendapatan).
Algoritma
Clustering
mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini [17]. a) Cluster 1 berisi populasi berusia muda dengan pendapatan rendah. b) Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi. c) Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah. Clustering adalah metode Data Mining yang Unsupervised, karena tidak ada satu atribut yang digunakan untuk memandu proses pembelajaran, jadi seluruh atribut input diperlakukan sama.
Gambar 2.6 Clustering [17]
16
3. Regression Metode Regression mirip dengan metode Classification, Metoda regression bertujuan untuk mecari pola dan menentukan sebuah
nilai
memecahkan
numerik. suatu
Regression
permasalahan,
digunakan
untuk
contohnya
untuk
memperkirakan kecepatan angin berdasarkan temperatur, tekanan udara, dan kelembaban. 4. Decision trees Decision trees atau pohon keputusan merupakan model prediktif yang dapat digambarkan seperti pohon, dimana setiap node didalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk menggolongkan data. Struktur ini dapat digunakan untuk membantu memperkirakan kemungkinan nilai setiap atribut data.
Metode Data Mining Salah satu metode data mining adalah model Cross-Standard Industry for Data Mining (CRISP-DM) yang terdiri dari 6 fase, yaitu [1]: 1) Fase pemahaman bisnis (Business Un derstanding) Pada tahap ini berfokus pada pemahaman mengenai tujuan dari proyek dan kebutuhan secara persepktif bisnis, kemudian mengubah hal tersebut menjadi sebuah permasalahan data mining dan rencana awal untuk mencapai tujuan tersebut. Kegiatan yang dilakukan antara lain: menentukan tujuan dan persyaratan dengan jelas secara keseluruhan, menerjemahkan tujuan tersebut serta menentukan pembatasan dalam perumusan masalah data mining, dan selanjutnya mempersiapkan strategi awal untuk mencapai tujuan tersebut. 2) Fase pemahaman data (Data Understanding)
17
Pada tahap ini dilakukan pengumpulan terhadap data, lalu kemudian mempelajari data tersebut dengan tujuan untuk mengenal data, melakukan identifikasi dan mengetahui kualitas dari data, serta mendeteksi subset yang menarik dari data yang dapat dijadikan hipotesa bagi informasi yang tersembunyi. 3) Fase pengolahan data (Data Preparation) Pada tahap ini dilakukan persiapan mengenai data yang akan digunakan pada tahap berikutnya. Kegiatan yang dilakukan antara lain: memilih kasus dan parameter yang akan dianalisis (Select Data), melakukan transformasi terhadap parameter tertentu (Transformation), dan melakukan pembersihan data agar data siap untuk tahap modelling (Cleaning). Data preprocessing bertujuan untuk mendapatkan data yang bersih dan siap untuk digunakan dalam penelitian. Tahapan yang dikerjakan adalah melakukan pengabaian atribut pada data mentah yang dianggap tidak relevan dengan hasil pengujian dan perubahan terhadap nilai data bahkan tipe data pada atribut dataset dengan tujuan untuk mempermudah pemahaman terhadap isi record dengan memperhatikan konsistensi data, missing value, dan redundancy pada data. 4) Fase pemodelan (Modelling) Pada tahap ini dilakukan penentuan terhadap teknik data mining, alat bantu data mining, dan algoritma data mining yang akan diterapkan. Lalu selanjutnya adalah melakukan penerapan teknik dan algoritma data mining tersebut kepada data dengan bantuan alat bantu. Jika diperlukan penyesuaian data terhadap teknik data mining tertentu, dapat kembali ke tahap persiapan data.
18
5) Fase Evaluasi (Evaluation) Pada tahap ini dilakukan pengujian terhadap model-model yang dikomparasi untuk mendapatkan informasi model yang paling akurat. Evaluasi dan validasi menggunakan metode confusion matrix dan kurva ROC. 6) Fase Penyebaran (Deployment) Setelah pembentukan model dan dilakukan analisa dan pengukuran pada tahap sebelumnya, selanjutnya pada tahap ini diterapkan model yang paling akurat dengan memakai data baru diluar data training dan data testing.
Clustering Menurut Deka, Clustering merupakan salah satu teknik data mining yang digunakan untuk mendapatkan kelompok-kelompok dari objek-objek yang mempunyai karakteristik yang umum di data yang cukup besar. Tujuan utama dari metode clustering adalah pengelompokan sejumlah data atau objek ke dalam cluster atau grup sehingga dalam setiap cluster akan berisi data yang semirip mungkin. Clustering melakukan pengelompokkan data yang didasarkan pada kesamaan antar objek, oleh karena itu klasterisasi digolongkan sebagai metode unsupervised learning. Menurut Oyelade, clustering dapat dibagi menjadi dua, yaitu hierarchical clustering dan nonhierarchical clustering. Hierarchical clustering adalah suatu metode pengelompokan data yang dimulai dengan mengelompokkan dua atau lebih objek yang memiliki kesamaan paling dekat. Kemudian proses diteruskan ke objek lain yang memiliki kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam pohon dimana ada hierarki (tingkatan) yang jelas antar objek, dari yang paling mirip sampai yang paling tidak mirip. Secara logika semua objek pada akhirnya hanya akan membentuk sebuah cluster.
19
Berbeda dengan metode hierarchical clustering, metode nonhierarchical clustering justru dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua cluster, tiga cluster, atau lain sebagainya). Setelah jumlah cluster diketahui, baru proses cluster dilakukan tanpa mengikuti proses hierarki. Metode ini biasa disebut dengan K-Means Clustering [16].
Algoritma K-Means Clustering K-Means merupakan salah satu algoritma clustering. Tujuan algoritma ini yaitu untuk membagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas. Hal ini berbeda dengan supervised learning yang menerima masukan berupa vektor (x1, y1), (x2, y2), ‌, (xi, yi), di mana xi merupakan data dari suatu data pelatihan dan yi merupakan label kelas untuk xi. Pada algoritma pembelajaran ini, komputer mengelompokkan sendiri data-data yang menjadi masukannya tanpa mengetahui terlebih dulu target kelasnya. Pembelajaran ini termasuk unsupervised learning. Masukan yang diterima adalah data atau objek dan k buah
kelompok
(cluster)
yang
diinginkan.
Algoritma
ini
akan
mengelompokkan data atau objek ke dalam k buah kelompok tersebut. Pada setiap cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut. K-Means ditemukan oleh beberapa orang yaitu Lloyd (1957, 1982), Forgey (1965), Friedman and Rubin (1967), and McQueen (1967). Ide dari clustering pertama kali ditemukan oleh Lloyd pada tahun 1957, namun hal tersebut baru dipublikasi pada tahun 1982. K-Means merupakan metode klasterisasi yang paling terkenal dan banyak
digunakan
di
berbagai
bidang
karena
sederhana,
mudah
diimplementasikan, memiliki kemampuan untuk mengklaster data yang besar, mampu menangani data outlier, dan kompleksitas waktunya linear O(nKT) dengan n adalah jumlah dokumen, K adalah jumlah kluster, dan T
20
adalah jumlah iterasi. K-Means merupakan metode pengklasteran secara partitioning yang memisahkan data ke dalam kelompok yang berbeda. Pada pengukuran jarak antara setiap objek data dan cluster centroid dapat menggunakan perhitungan seperti euclidean distance, manhattan distance, dan minkowsky distance. Adapun karakteristik dari algoritma KMeans salah satunya adalah sangat sensitif dalam penentuan titik pusat awal klaster karena K-Means membangkitkan titik pusat klaster awal secara random. Pada saat pembangkitan awal titik pusat yang random tersebut mendekati solusi akhir pusat klaster, K-Means mempunyai posibilitas yang tinggi untuk menemukan titik pusat klaster yang tepat. Sebaliknya, jika awal titik pusat tersebut jauh dari solusi akhir pusat klaster, maka besar kemungkinan ini menyebabkan hasil pengklasteran yang tidak tepat. Akibatnya K-Means tidak menjamin hasil pengklasteran yang unik. Inilah yang menyebabkan metode K-Means sulit untuk mencapai optimum global, akan tetapi hanya minimum lokal. Selain itu, algoritma K-Means hanya bisa digunakan untuk data yang atributnya bernilai numerik. Metode K-Means Clustering adalah proses untuk mengelompokkan data ke dalam sebuah cluster dengan titik pusat yang berbeda-beda setiap cluster. Proses K-Means Clustering tersebut meliputi 5 proses, yaitu [18]: 1) Menentukan Titik Pusat Cluster Menentukan titik pusat cluster adalah langkah awal untuk proses K-Menas Clustering. Fungsi proses ini adalah untuk menentukan titik awal sebagai patokan untuk mencari jarak antara data ke cluster yang sudah ditentukan. Titik awal pusat cluster disebut juga dengan centroid. Untuk menentukan titik pusat setiap cluster bisa dilakukan dengan mencari rata-rata dari data yang akan diolah ataupun sesuai keinginan.
21
2) Menghitung Jarak Data ke Setiap Cluster Setelah menentukan titik pusat di setiap cluster proses selanjutnya adalah menghitung jarak antara data ke setiap cluster yang sudah dibentuk. Rumus untuk mencari jarak (distance) dari satu cluster adalah
Rumus 2.1 Rumus Mencari Jarak Data ke Setiap Cluster √(đ?‘‹đ?‘– − đ?‘‹đ?‘Žđ?‘Łđ?‘” )2 + (đ?‘Œđ?‘– − đ?‘‹đ?‘Žđ?‘Łđ?‘” )2 + (đ?‘?đ?‘˜đ?‘– − đ?‘?đ?‘˜đ?‘— )2 Dimana: Xi
: Data pertama (diambil dari atribut pertama)
Xavg
: Titik pusat cluster / centroid untuk atribut pertama
Yi
: Data kedua (diambil dari atribut kedua)
Yavg
: Titik pusat cluster / centroid untuk atribut kedua
Zi
: Data ketiga (diambil dari atribut ketiga)
Zavg
: Titik pusat cluster / centroid untuk atribut pertama
Rumus tersebut adalah rumus untuk menentukan jarak dari satu baris data ke satu cluster tertentu. 3) Mengalokasikan Data kedalam Cluster Setelah mendapatkan jarak antara setiap data ke setiap cluster yang terbentuk maka proses selanjutnya adalah clustering atau mengelompokkan dan mengalokasikan data ke dalam cluster. Untuk mengelompokkan data ke dalam cluster ini cukup dilihat dari jarak terdekat dari setiap cluster. Apabila jarak yang didapatkan dari suatu data adalah dengan urutan paling kecil di setiap cluster, maka data termasuk kedalam cluster pertama.
22
4) Menentukan Titik Pusat Cluster Baru Setelah mengalokasikan data ke dalam cluster yang terbentuk maka proses selanjutnya adalah menentukan titik pusat cluster baru dengan cara yang sama yaitu mencari rata-rata di setiap atribut data. Tetapi dalam perhitungan kali ini sedikit berbeda dari yang pertama, apabila proses pertama adalah mencari ratarata dari semua atribut data maka untuk menentukan titik pusat cluster baru ini data yang digunakan sesuai dengan clusternya masing-masing. Apabila data yang masuk ke cluster satu adalah data pertama, ketiga, kelima, dan keenam, maka rata-rata yang dicari hanya menggunakan data pertama, ketiga, kelima, dan keenam. 5) Memverifikasi Titik Pusat Cluster Setelah mendapatkan titik pusat cluster baru maka proses selanjutnya adalah memverifikasi titik pusat cluster baru tersebut dengan titik pusat cluster yang lama. Apabila hasil titik pusat cluster baru yang didapat sama dengan titik pusat cluster yang lama, maka proses K-Means sudah selesai dan hasil dari proses K-Means Clustering sudah didapatkan dan data yang diklasifikasi sudah tidak bisa berubah-ubah lagi. Tetapi jika hasil titik pusat cluster baru yang didapat berbeda dari titik pusat cluster yang lama, maka proses K-Means tetap dilanjutkan dan mulai lagi dari proses kedua atau menghitung jarak data ke setiap cluster. Menurut Daniel dan Eko, Langkah-langkah algoritma K-Means adalah sebagai berikut [19]: a) Pilih secara acak k buah data sebagai pusat cluster. b) Jarak antara data dan pusat cluster dihitung menggunakan Euclidian Distance. Untuk menghitung jarak semua data ke
23
setiap titik pusat cluster dapat menggunakan teori jarak Euclidean yang dirumuskan sebagai berikut: = √(đ?‘‹1đ?‘– − đ?‘‹1đ?‘— )2 + (đ?‘‹2đ?‘– − đ?‘‹2đ?‘— )2 + â‹Ż + (đ?‘‹đ?‘˜đ?‘– − đ?‘‹đ?‘˜đ?‘— )2
D (i,j) dimana:
D (i,j) = Jarak data ke i ke pusat cluster j Xki
= Data ke i pada atribut data ke k
Xkj
= Titik pusat ke j pada atribut ke k
c) Data ditempatkan dalam cluster yang terdekat, dihitung dari tengah cluster. d) Pusat cluster baru akan ditentukan bila semua data telah ditetapkan dalam cluster terdekat. e) Proses penentuan pusat cluster dan penempatan data dalam cluster diulangi sampai nilai centroid tidak berubah lagi. Berikut ini adalah contoh penerapan algoritma K-Means [16]: Table 2.1 Data Mahasiswa No
Nama
Jurusan
Kota Asal
IPK
1
Ade Supryan Stefanus
IS
Jakarta
3,16
2
Adelina Ganardi Putri Hardi
ACC
Semarang
3,22
3
Adeline Dewita
BF
Bekasi
3,29
4
Adiputra
IB
Jakarta
2,83
5
Afrieska Laura Trisyana
PR
Jakarta
3,15
6
Agam Khalilullah
IB
Banda Aceh
3,25
7
Agus Mulyana Jungjungan
IB
Bogor
3,43
8
Agusman
PR
Bekasi
3,06
24
9
Aidil Friadi
BF
Banda Aceh
3,36
10
Ajeng Putri Ariandhani
ACC
Bandung
3,28
Transformasi Data Agar data di atas dapat diolah dengan menggunakan metode k-means clustering, maka data yang berjenis data nominal seperti kota asal dan jurusan harus diinisialisasikan terlebih dahulu dalam bentuk angka. Table 2.2 Inisialisasi Data Wilayah Kota Asal Wilayah
Frekuensi
Inisial
Jakarta
84
1
Jawa Barat
82
2
Sumatera Utara
28
3
Sulawesi
14
4
Jawa Timur
13
5
Sumatera Selatan
13
6
Bali
8
7
Kalimantan
1
8
Table 2.3 Inisialisasi Data Jurusan Jurusan
Singkatan
Frekuensi
Inisial
ACC
46
1
Management, concentration in International Business
IB
37
2
Public Relation
PR
35
3
Management, concentration in
BF
28
4
Accounting
25
Banking & Finance Industrial Engineering
IE
23
5
Information Technology
IT
20
6
Management, concentration in Marketing
MKT
18
7
Visual Communication Design
VCD
12
8
Management, concentration in Hotel & Tourism Management
HTM
9
9
Electrical Engineering
EE
6
10
Business Administration
BA
4
11
International Relations
IR
2
12
HRM
1
13
IS
1
14
MGT
1
15
Management, concentration in Human Resources Management Information System Management
Pengolahan data Setelah semua data mahasiswa ditransformasi ke dalam bentuk angka, maka data-data tersebut telah dapat dikelompokan dengan menggunakan algoritma K-Means Clustering. Untuk dapat melakukan pengelompokan data-data tersebut menjadi beberapa cluster perlu dilakukan beberapa langkah, yaitu: 1) Tentukan jumlah cluster yang diinginkan. Dalam penelitian ini data-data yang ada akan dikelompokkan mejadi tiga cluster. 2) Tentukan titik pusat awal dari setiap cluster. Dalam penelitian ini titik pusat awal ditentukan secara random dan didapat titik pusat dari setiap cluster dapat dilihat pada tabel 2.4.
26
Table 2.4 Titik Pusat Awal Setiap Cluster Titik Pusat awal
Nama
Jurusan
Kota Asal
IPK
Cluster 1
Dally Teguh Sesario
9
3
2,94
Cluster 2
Hervina Juliana
1
1
3,18
Cluster 3
Pascal Muhammadi
1
2
3,15
3) Tempatkan setiap data pada cluster. Dalam penelitian ini digunakan metode hard k-means untuk mengalokasikan setiap data ke dalam suatu cluster, sehingga data akan dimasukan dalam suatu cluster yang memiliki jarak paling dekat dengan titik pusat dari setiap cluster. Untuk mengetahui cluster mana yang paling dekat dengan data, maka perlu dihitung jarak setiap data dengan titik pusat setiap cluster. Sebagai contoh, akan dihitung jarak dari data mahasiswa pertama ke pusat cluster pertama: D (1,1) = √(14 − 9)2 + (1 − 3)2 + (3,16 − 2,94)2 = 5,390 Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswa pertama dengan pusat cluster pertama adalah 5,390. Jarak data mahasiswa pertama ke pusat cluster kedua: D (1,2) = √(14 − 1)2 + (1 − 1)2 + (3,16 − 3,18)2 = 13,000 Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswa pertama dengan pusat cluster kedua adalah 13. Jarak data mahasiswa pertama ke pusat cluster ketiga: D (1,3) = √(14 − 1)2 + (1 − 2)2 + (3,16 − 3,15)2 = 13,038 Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswa pertama dengan pusat cluster ketiga adalah 13.038.
27
Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak data mahasiswa pertama yang paling dekat adalah dengan cluster 1, sehingga data mahasiswa pertama dimasukkan ke dalam cluster 1. Hasil perhitungan selengkapnya untuk 5 data mahasiswa pertama dapat di lihat pada tabel 2.5. Table 2.5 Contoh Hasil Perhitungan Setiap Data ke Setiap Cluster Jarak Ke No 1 2
Nama Ade Supryan Stefanus Adelina Ganardi Putri Hardi
Jurusan
Kota Asal
IPK
C1
C2
C3
Jarak terdekat ke Cluster
14
1
3,16 5,390
13,000
13,038
1
1
5
3,22 8,251
4,000
3,001
3
3
Adeline Dewita
4
2
3,29 5,111
3,164
3,003
3
4
Adiputra
2
1
2,83 7,281
1,059
1,450
2
5
Afrieska Laura Trisyana
3
1
3,15 6,328
2,000
2,236
2
4) Setelah semua data ditempat ke dalam cluster yang terdekat, kemudian hitung kembali pusat cluster yang baru berdasarkan rata-rata angggota yang ada pada cluster tersebut. 5) Setelah didapatkan titik pusat yang baru dari setiap cluster, lakukan kembali dari langkah ketiga hingga titik pusat dari setiap cluster tidak berubah lagi dan tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain. Dalam contoh ini, iterasi clustering data mahasiswa terjadi sebanyak 7 kali iterasi. Pada iterasi ke-7 ini, titik pusat dari setiap cluster sudah tidak berubah dan tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain.
28
Dari hasil cluster 1, terlihat bahwa karakteristik mahasiswa pada cluster 1 didominasi oleh mahasiswa yang berasal dari jurusan Information Technology dan Marketing. Sedangkan, berdasarkan kota asal didominasi oleh mahasiswa yang berasal dari wilayah kota asal DKI Jakarta dan Jawa Barat, sehingga dapat disimpulkan bahwa rata- rata mahasiswa pada cluster 1 yang berasal dari wilayah kota asal DKI Jakarta dan Jawa Barat mengambil jurusan Information Technology dan Marketing.
Pengujian Hasil Clustering K-Means Metode pengujian yang digunakan untuk menentukan kriteria penilaian bagus atau tidaknya hasil dari perhitungan Clustering K-Means adalah dengan menggunakan metode Between-Class Variation (BCV) dan WithinClass Variation (WCV) pada iterasi terakhir yang sering disebut dengan rasio. Apabila hasil perhitungan pengujian yang diperoleh besar, maka semakin bagus tingkat kualitas clustering tersebut. BCV merupakan rata-rata dari centroid, sedangkan WCV adalah nilai keseluruhan dari jarak minimum yang telah dijumlahkan. Rumus perhitungannya adalah sebagai berikut [20]: Rumus 2.2 Rumus Between-Class Variation (BCV) 1
BCV = đ?‘ đ?‘˜ ∑đ?‘˜đ?‘– = 1 đ?‘‘(đ?‘šđ?‘– , đ?‘šđ?‘– ) Dimana: k
= Jumlah cluster
mi
= Jumlah anggota dari cluster ke-i
i
= Nama yang mewakili cluster yang dibentuk
mi
= Jumlah anggota dari cluster ke-i
Rumus 2.3 Rumus Within-Class Variation (WCV)
29
WCV = ∑đ?‘›đ?‘—=đ?‘– ∑đ?‘?∈đ?‘?đ?‘– đ?‘‘(đ?‘?, đ?‘šđ?‘– )2 Dimana: pâ‚Źci = Jumlah semua data
Rasio
k
= Jumlah cluster
p
= Cluster jarak terdekat
mi
= Jumlah anggota dari cluster ke-i đ?‘Šđ?‘Şđ?‘˝
= đ?‘žđ?‘Şđ?‘˝
Apabila nilai rasio yang didapat semakin kecil maka semakin bagus pula tingkat hasil dari akurasi cluster [21], kriteria hasil ukuran rasio dapat dilihat pada tabel 2.6. Table 2.6 Kriteria Pengukuran Rasio Nilai Rasio
Kriteria
≤ 0,25
Sangat baik
0,25- 0,50
Baik
0,50- 0,75
Kurang baik
0,75– 1,00
Buruk
Metode Receiver Operating Characteristic (ROC) Tingkat akurasi diukur dengan cara menggunakan metode ROC. Selain mencari nilai akurasi pada metode ini juga dapat dicari nilai sensitivitas dan spesifitas [22], adapun persamaannya dapat dilihat sebagai berikut: Akurasi =
đ?‘‡đ?‘?+đ?‘‡đ?‘› đ?‘‡đ?‘?+đ?‘‡đ?‘›+đ??šđ?‘?+đ??šđ?‘›
Sensifitas
=
Spesifitas
=
đ?‘‡đ?‘? đ?‘‡đ?‘?+đ??šđ?‘› đ?‘‡đ?‘? đ?‘‡đ?‘?+đ??šđ?‘?
30
Dimana: Tp
= True positif (Nilai kebenaran pada nilai centeroid)
Tn
= True negative (Nilai centeroid hasil clustering)
Fp
= False positif (Nilai kebeneraan centeroid pada cluser lain)
Fn
= False Negative (Nilai kebeneraan centeroid terakhir pada cluser lain)
Apabila hasil dari clustering mendekati titik kurva 1,00 maka akurasi yang didapatkan dalam kategori bagus, untuk melihat hasil akurasi masuk kedalam kategori yang mana, perhatikan Tabel di bawah ini. Table 2.7 Standar Receiver Operating Characteristic (ROC) Nilai Rasio
Kategori
0,80-1,00
Sangat baik
0,60-0,80
Baik
0,40-0,60
Cukup Baik
0,20-0,40
Kurang Baik
0,00-0,20
Tidak Baik
31
2.3
Kerangka Pemikiran Kerangka pemikiran merupakan garis besar dari langkah-langkah penelitian yang sedang dilakukan, kerangka pemikiran dijadikan acuan untuk melakukan tahap-tahap yang sedang dilakukan dalam penelitian. Masalah Bagaimana menerapkan metode Data Mining dengan algoritma K-Means Clustering untuk menentukan wilayah yang tepat untuk promosi Universitas Islam Nahdlatul Ulama Jepara.
Pengumpulan Data Pengambilan data di UPT Pusat Data dan Pengembangan IT Universitas Islam Nahdlatul Ulama Jepara cukup dengan melampirkan surat izin penelitian dari pihak UNISNU dan melampirkan proposal penelitian ke bagian akademik. Data yang diambil adalah data mahasiswa Universitas Islam Nahdlatul Ulama Jepara angkatan 2016 sampai dengan angkatan 2018.
Metode Penelitian Algoritma
Tools
K-Means Clustering (Euclidean Distance)
Microsoft Excel & RapidMiner Studio
Evaluasi Pengukuran Rasio dan Metode Receiver Operating Characteristic (ROC)
Tujuan atau Hasil 1. Menerapkan metode Data Mining dengan algoritma K-Means Clustering untuk menentukan wilayah yang tepat untuk promosi Universitas Islam Nahdlatul Ulama Jepara. 2. Untuk mengetahui sebaran wilayah berdasarkan data mahasiswa angkatan 2016 sampai 2018. 3. Untuk mengetahui prioritas wilayah yang tepat untuk cluster yang terbentuk?
Gambar 2.7 Kerangka pemikiran
BAB III METODE PENELITIAN
3.1
Desain Penelitian Metode yang digunakan dalam penelitian tugas akhir ini adalah secara eksperimen, yaitu peneliti menerapakan metode Data Mining dengan algoritma K-Means Clustering pada data mahasiswa UNISNU Jepara angkatan 2016 sampai dengan angkatan 2018 di Universitas Islam Nahdlatul Ulama Jepara untuk dianalisa dan dikelompokkan sesuai dengan persebaran wilayah dan sesuai asal sekolah berdasarkan indeks prestasi kumulatif selama dua semester awal yaitu pada semester 1 dan semester 2. Yang nantinya diuji atau diolah dengan microsoft excel dan rapidminer studio. Kemudian hasilnya akan dibandingkan berdasarkan kategori atau pengklasteran yang sudah ditentukan, yaitu tiga kategori: pertama kategori wilayah terbanyak, kedua kategori wilayah sedang, dan ketiga wilayah kategori sedikit yang nantinya dijadikan bahan pertimbangan dalam media promosi Universitas Islam Nahdlatul Ulama Jepara.
3.2
Pengumpulan Data Untuk melakukan proses K-Means Clustering tentu membutuhkan sebuah data yang cukup banyak dan sesuai dengan yang dibutuhkan, di dalam penelitian ini peneliti menggunakan data mahasiswa UNISNU Jepara angkatan 2016 sampai dengan angkatan 2018 di Universitas Islam Nahdlatul Ulama Jepara. Pengambilan data di UPT Pusat Data dan Pengembangan IT Universitas Islam Nahdlatul Ulama Jepara cukup dengan melampirkan surat izin penelitian dari pihak UNISNU dan melampirkan proposal penelitian ke bagian akademik Universitas Islam Nahdlatul Ulama Jepara. Setelah mendapat balasan dari pihak Universitas Islam Nahdlatul Ulama Jepara, data bisa diambil ke bagian UPT Pusat Data dan Pengembangan IT dengan cara
32
33
mengkopi file berupa file excel. File yang didapatkan sejumlah 2 file yang terdiri dari file mahasiswa angkatan selama tiga angkatan terakhir, dan file data Indeks Prestasi Kumulatif (IPK) mahasiswa. File pertama adalah file data mahasiswa Universitas Islam Nahdlatul Ulama Jepara angkatan 2016 sampai angkatan 2018. Jumlah data yang didapatkan berjumlah 3910 data mahasiswa yang terdiri dari beberapa kolom atau beberapa atribut yaitu: 1. Nomor Induk Mahasiswa (NIM) 2. Nama 3. Alamat 4. Program Studi 5. Tahun Akademik 6. Asal Sekolah 7. Jenis Sekolah 8. Jurusan Sekolah File kedua adalah file data Indeks Prestasi Kumulatif (IPK) mahasiswa dari angkatan 2016 sampai angkatan 2018. Jumlah data mahasiswa yang didapat dalam file ini berjumlah 3910 data mahasiwa. File kedua ini berisikan beberapa kolom yaitu kolom NIM, tahun semester, dan IPK.
3.3
Lokasi Penelitian Lokasi dari penelitian adalah Universitas Islam Nahdlatul Ulama Jepara yang disingkat UNISNU beralamat di Jalan Taman Siswa, Pekeng, Jl. Kauman, Kec. Tahunan, Kabupaten Jepara, Jawa Tengah 59451.
3.4
Pengolahan Data Dalam melakukan penelitian ini, dibutuhkan peralatan perangkat keras (Hardware) dan perangkat lunak (Software). Untuk lebih lengkapnya di jelaskan berikut ini:
34
3.4.1 Perangkat Keras Perangkat keras (hardware) yang digunakan dalam penelitian ini yaitu menggunakan 1 buah laptop yang digunakan selama penelitian. Spesifikasi laptop sebagai berikut: LENOVO YOGA 520, Intel CORE i5-7200U CPU 2.70 GHz, Ram 4gb, Hardisk Storage 1 Terabyte, Windows 10 Pro 64bit.
3.4.2 Perangkat Lunak Perangkat lunak memiliki peran penting pada peneilitian ini karena hasil dari analisis data dapat diketahui dari pengolahan menggunakan perangkat lunak dalam mengetahui hasilnya. Pada penelitian ini, perangkat lunak yang dipakai adalah: a) Sistem Operasi Dalam penelitian ini sistem operasi yang dipakai adalah sistem operasi windows 10 Pro 64bit. b) Microsoft Word Microsoft Word dalam penelitian disini digunakan untuk menyusun laporan penelitian, Microsoft Word yang dipakai adalah versi 2019. c) Microsoft Excel Microsoft Excel dalam penelitian disini digunakan untuk mengolah data mahasiswa Universitas Islam Nahdlatul Ulama Jepara, Microsoft Excel yang dipakai adalah versi 2019.
35
3.5
Tahapan Metode Dalam penelitian ini, peneliti menggunakan salah satu metode dalam Data Mining yaitu metode K-Means Clustering. Dalam metode ini memiliki beberapa tahapan. Tahapan yang dilakukan adalah:
3.5.1 Pre-processing Data Tahap pre-processing data adalah tahap dimana data yang sudah didapatkan, dipilah, dan dipisahkan agar mendapatkan data yang dibutuhkan untuk proses selanjutnya. Tahapan ini mempunyai beberapa proses dimana setiap proses tersebut saling berhubungan satu sama lainnya. Proses dalam tahapan pre-processing adalah sebagai berikut: 1. Data Reduction Data reduction adalah proses untuk mereduksi atau mengurangi dimensi, atribut, ataupun sejumlah data yang tidak dibutuhkan dalam suatu file data. Data reduction sangat berguna untuk mendapatkan atribut dan sejumlah data yang akan digunakan di dalam penelitian ini. 2. Data Cleaning Data cleaning adalah proses dalam tahapan preprocessing untuk mengisi data kosong atau blank apabila memungkinkan, duplikasi data, memperbaiki data yang tidak sesuai dengan ketentuan atau salah ketik seperti kurang huruf dan kelebihan huruf, mengubah dan memodifikasi data agar data yang akan diolah adalah data yang konsisten, mengatur data yang kurang rapi dalam penulisan huruf besar dan kecil, dan mengganti format penulisan angka dan huruf sesuai dengan yang dibutuhkan.
36
3. Data Transformation Karena metode K-Means Clustering adalah metode yang bisa dilakukan apabila data yang dipakai adalah data berupa angka, maka proses transformation ini sangat dibutuhkan. Proses transformation adalah tahap untuk mengubah data atribut yang selain angka ke dalam nilai angka agar data tersebut dapat diolah menggunakan algoritma K-Means Clustering. 4. Data Integration Data integration adalah suatu proses untuk menggabungkan atau mengintegrasikan data dari beberapa file sumber. Data integration hanya dilakukan jika data berasal dari tempat yang berbeda-beda (sumber data tidak hanya dari 1 tempat). Langkah yang
dilakukan
antara
lain
mengintegrasikan
skema,
mengidentifikasi masalah entitas, dan mendeteksi sekaligus menyelesaikan konflik pada nilai data.
3.5.2 K-Means Clustering Dari eksperimen ini di ambil sampel data Universitas Islam Nahdlatul Ulama Jepara, berikut ini adalah sampel data mahasiswa angkatan 2016 sampai angkatan 2018. Table 3.1 Data Mahasiswa 2016 sampai 2018 No
NIM
Nama
Kecamatan Asal
Asal Sekolah
IPK
1
161240000470 Akhmad Toha
Batealit
SMK
3,66
2
161240000471
Bima Muluk Maulana Ishaq
Mlonggo
SMK
3,52
3
161240000473 Taufiq Hidayat
Pakis Aji
SMK
3,54
4
161240000474 Miftahul Huda
Mijen
SMK
2,96
37
Muhammad Hidayatul Mustafid
5
161240000475
Donorojo
SMK
2,62
6
161240000476 Anis Safitri
Bangsri
MA
3,48
7
161240000477
Jepara
SMK
3,47
8
171110002054 Emilia Inta Argadea
Jepara
SMA
3,17
9
171110002089 Heri Fajar Saputra
Batealit
SMA
2,10
10
171110002058 Fania Eka Kumala
Jepara
SMK
3,54
11
171110002187 Ade Rahmawati
Bangsri
SMK
2,08
12
171110002060 Aldo Ilham Hadzafi
Tahunan
SMK
2,22
13
171110002057
Batealit
MA
2,71
14
171110002062 Akhmad Safii
Tahunan
MA
3,15
15
181110002277 Anwar Ramadan
Jepara
SMK
3,32
16
181110002279 Dinda Laili Savitri
Batealit
SMK
3,17
17
181110002429
Jepara
SMK
3,43
18
181120002245 Reyhan Ade Tirany
Jepara
SMA
3,55
19
181130001615 Rizki Nor Amalia
Pecangaan
SMA
3,51
20
181240000747
Jepara
SMK
3,40
21
181250000256 Siti Marhamah
Jepara
SMK
3,82
Dimas Cornellya Agatta
Venny Aulia Rohmah
Unsaa Nailul Munaa
Muhammad Agung Prayogi
1. Transformasi Data Transpormasi data dilakukan untuk mengubah data agar data dapat diolah dengan menggunakan metode K-Means Clustering. Data yang berjenis nominal seperti Kecamatan Asal dan Asal Sekolah harus dilakukan proses inisialisasi data terlebih dahulu ke dalam bentuk angka/numerikal.
38
Table 3.2 Inisialisasi Data Kecamatan Asal Kecamatan Asal
Frekuensi
Inisial
Jepara
8
1
Batealit
4
2
Bangsri
2
3
Tahunan
2
4
Donorojo
1
5
Mijen
1
6
Mlonggo
1
7
Pakis Aji
1
8
Pecangaan
1
9
Table 3.3 Inisialisasi Data Asal Sekolah Asal Sekolah
Frekuensi
Inisial
SMK
14
1
SMA
4
2
MA
3
3
2. Pengolahan Data Setelah semua data mahasiswa ditransformasi ke dalam bentuk angka, maka data-data tersebut telah dapat dikelompokan dengan menggunakan algoritma K-Means Clustering. Untuk dapat melakukan pengelompokan data-data tersebut menjadi beberapa cluster perlu dilakukan beberapa langkah, yaitu:
39
1. Tentukan jumlah cluster yang diinginkan. Dalam eksperimen ini data-data yang ada akan dikelompokkan mejadi tiga cluster. 2. Tentukan titik pusat awal dari setiap cluster. Dalam eksperimen ini titik pusat awal ditentukan secara random dan didapat titik pusat dari setiap cluster dapat dilihat pada tabel 3.4. Table 3.4 Titik Pusat Awal Setiap Cluster
Titik Pusat
Kecamatan Asal
Asal Sekolah
IPK
Cluster 1
Mijen
SMK
2,956
Cluster 2
Bangsri
SMK
2,077
Cluster 3
Jepara
SMA
3,554
3. Tempatkan setiap data pada cluster. Dalam eksperimen ini digunakan metode hard k-means untuk mengalokasikan setiap data ke dalam suatu cluster, sehingga data akan dimasukan dalam suatu cluster yang memiliki jarak paling dekat dengan titik pusat dari setiap cluster. Untuk mengetahui cluster mana yang paling dekat dengan data, maka perlu dihitung jarak setiap data dengan titik pusat setiap cluster. Sebagai contoh, akan dihitung jarak dari data mahasiswa pertama ke pusat cluster pertama: D (1,1) = √(2 − 6)2 + (1 − 1)2 + (3,663 − 2,956)2 = 4,062 Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswa pertama dengan pusat cluster pertama adalah 4,062. Jarak data mahasiswa pertama ke pusat cluster kedua: D (1,2) = √(2 − 3)2 + (1 − 1)2 + (3,663 − 2,077)2 = 1,875
40
Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswa pertama dengan pusat cluster kedua adalah 1,875. Jarak data mahasiswa pertama ke pusat cluster ketiga: D (1,3) = √(2 − 1)2 + (1 − 2)2 + (3,663 − 3,554)2 = 1,418 Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswa pertama dengan pusat cluster ketiga adalah 1,418. Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak data mahasiswa pertama yang paling dekat adalah dengan cluster 3, sehingga data mahasiswa pertama dimasukkan ke dalam cluster 3. Hasil perhitungan selengkapnya untuk 21 data mahasiswa pertama dapat di lihat pada tabel 3.5. Table 3.5 Contoh Hasil Perhitungan Setiap Data ke Setiap Cluster
No
NIM
Asal Kecamat Sekol an Asal IPK ah
Jarak Ke C1
C2
C3
Jarak terdekat ke Cluster
1
161240000470
2
1
3,66 5,51
2,19
0,88
3
2
161240000471
7
1
3,52 0,58
3,40
5,69
1
3
161240000473
8
1
3,54 0,58
4,36
6,68
1
4
161240000474
6
1
2,96 1,58
2,35
4,70
1
5
161240000475
5
1
2,62 2,63
1,45
3,75
2
6
161240000476
3
3
3,48 4,83
1,64
2,31
2
7
161240000477
1
1
3,47 6,51
3,01
0,57
3
8
171110002054
1
2
3,17 6,55
2,84
0,68
3
9
171110002089
2
2
2,10 5,70
1,91
1,47
3
10
171110002058
1
1
3,54 6,51
3,03
0,60
3
11
171110002187
3
1
2,08 4,69
1,30
2,10
2
41
12
171110002060
4
1
2,22 3,70
0,96
2,90
2
13
171110002057
2
3
2,71 5,81
2,16
1,81
3
14
171110002062
4
3
3,15 3,92
1,29
3,10
2
15
181110002277
1
1
3,32 6,51
2,98
0,54
3
16
181110002279
2
1
3,17 5,51
2,02
0,79
3
17
181110002429
1
1
3,43 6,51
3,00
0,56
3
18
181120002245
1
2
3,55 6,55
2,93
0,73
3
19
181130001615
9
2
3,51 1,68
5,27
7,69
1
20
181240000747
1
1
3,40 6,50
2,99
0,55
3
21
181250000256
1
1
3,82 6,52
3,12
0,76
3
4. Setelah semua data ditempat ke dalam cluster yang terdekat, kemudian hitung kembali pusat cluster yang baru berdasarkan rata-rata angggota yang ada pada cluster tersebut. 5. Setelah didapatkan titik pusat yang baru dari setiap cluster, lakukan kembali dari langkah ketiga hingga titik pusat dari setiap cluster tidak berubah lagi dan tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain. Dalam sampel data ini, iterasi clustering data mahasiswa terjadi sebanyak 5 kali iterasi. Pada iterasi ke-4 ini, titik pusat dari setiap cluster sudah tidak berubah dan tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain.
3.6
Evaluasi Dalam eksperimen sampel data Universitas Islam Nahdlatul Ulama Jepara, dari data mahasiswa angkatan 2016 sampai angkatan 2018, pasti memiliki nilai error, semakin kecil nilai error yang dimiliki pada hasil
42
perhitungan maka semakin bagus pula hasil yang akan didapatkan. Pada penelitian ini menghitung nilai error menggunakan persamaan yang pada sebelumnya sudah dijelaskan, perhitungan nilai error terdapat pada proses berikut ini:
3.6.1 Pengujian Metode BCV dan WCV 1. Menentukan iterasi keberapa akan dihitung Untuk menentukan iterasi diambil pada iterasi terakhir karena iterasi terakhir memiliki kualitas centeroid yang lebih baik dari sebelumnya, pada penelitian ini menggunakan sampel data perhitungan Universitas Islam Nahdlatul Ulama Jepara, dari data mahasiswa angkatan 2016 sampai angkatan 2018, untuk lebih jelasnya dapat Tabel di bawah ini. Table 3.6 Nilai Centroid pada iterasi terakhir Titik Pusat Kecamatan Asal
Asal Sekolah
IPK
Cluster 1
7,50
1,25
3,38
Cluster 2
3,80
1,80
2,71
Cluster 3
1,33
1,42
3,28
Kemudian hitung nilai Centroid dengan persamaan Between-Class Variation (BCV). BCV = √(7,50 − 3,80)2 + (1,25 − 1,80)2 + (3,38 − 2,71)2 + BCV = √(7,50 − 1,33)2 + (1,25 − 1,42)2 + (3,38 − 2,28)2 + BCV = √(3,80 − 1,33)2 + (1,80 − 1,42)2 + (2,71 − 2,28)2 BCV = 12,53
43
2. Menentukan jarak minimum centeroid Pada proses ini menggunakan jarak minimum pusat centeroid yang didapat pada iterasi terakhir, dapat dilihat pada tabel 3.5. Setelah mendapatkan jarak minimum dengan nilai pusat centroid maka langkah selanjutnya menghitung seluruh jarak minimum dengan persamaan WithinClass Variation (WCV) sebagai berikut: WCV = 0,882 + 0,582 + 0,582 + 1,582 +. . . +0,552 + 0,762 Sehingga hasil yang didapat adalah WCV = 25,01 3. Menghitung perbandingan BCV dengan WCV Pada langkah terakhir adalah menghitung nilai perbandingan BCV dengan WCV sehingga menghasilkan nilai error hitung dengan persamaan Rasio seperti terlihat pada hasil dibawah ini. Rasio =
12,53 25,01
= 0,050
Untuk menentukan bagus atau tidaknya hasil pengujian dari nilai rasio yang didapat maka harus memperhatikan kriteria pengukuran rasio, dapat dilihat pada tabel 2.6. Hasil pengujian menggunakan perbandingan BetweenClass Variation (BCV) dan Within-Class Variation (WCV) mendapatkan nilai rasio yang tidak tinggi yaitu 0,50 dan artinya tingkat penggunaan nilai sample data Centroid memiliki kualitas yang baik.
3.6.2 Pengujian Metode ROC Metode ROC digunakan untuk menghitung nilai akurasi hasil clustering yang telah diproses oleh sistem. Selain nilai akurasi, nilai sensifitas dan nilai spesifitas dapat dihitung juga. Adapun untuk mencari nilai akurasi dapat dicari dengan persamaan akurasi, untuk mencari nilai sensifitas dengan persamaan sensifitas, dan mencari nilai spesifitas dengan persamaan spesifitas. Pada penelitian ini digunakan sampel data dari hasil clustering data
44
mahasiswa angkatan 2016 sampai angkatan 2018 yang berupa data nilai centeroid awal dan nilai centeroid pada iterasi terakhir. Data tersebut ditampilkan dalam tabel 3.7 di bawah ini. Table 3.7 Nilai Centroid pada iterasi terakhir
Titik Pusat
Centroid Awal
Centroid Iterasi Terakhir
Cluster 1
2,96
3,38
Cluster 2
2,08
2,71
Cluster 3
3,17
3,28
Akurasi
=
Sensifitas = Spesifitas =
2,96+3,38 2,96+3,38+3,17+3,28 2,96 2,96+3,28 2,96 2,96+3,17
= 0,50
= 0,47 = 0,48
Sesuai dengan perhitungan nilai akurasi yang didapat adalah 0,50. Nilai akurasi ini berada dalam kategori baik berdasarkan referensi pada tabel 3.8 dibawah ini. Table 3.8 Standar Receiver Operating Characteristic (ROC) Nilai Rasio
Kategori
0,80-1,00
Sangat baik
0,60-0,80
Baik
0,40-0,60
Cukup Baik
0,20-0,40
Kurang Baik
0,00-0,20
Tidak Baik
BAB IV HASIL PENELITIAN DAN PEMBAHASAN
4.1
Pre-Processing Data Preprocessing data adalah tahapan dari Data Mining yaitu suatu proses atau tahapan yang dilakukan untuk mengolah data mentah menjadi data yang berkualitas atau inputan yang baik untuk dilanjutkan ke proses selanjutnya. Tahap preprocessing data ini adalah tahap yang sangat krusial atau sangat penting dan harus dilakukan dengan teliti karena proses Data Mining membutuhkan data yang konsisten dalam penulisan, benar dalam formatnya, tidak ada data yang kosong, duplikasi data, dan lain lain. Data yang tidak berkualitas maka hasil dari proses Data Mining ini akan menghasilkan hasil yang tidak berkualitas juga.
Gambar 4.1 Data Mentah Mahasiswa UNISNU Jepara Dalam data mentah yang sudah didapatkan terdapat banyak data yang kurang sesuai seperti kata kata yang salah dalam penulisan atau kehilangan salah satu huruf atau sering disebut typo, duplikasi data, dan singkatan. Tahapan preprocessing memiliki beberapa proses yaitu:
45
46
4.1.1 Data Reduction Data reduction adalah proses untuk mengurangi atau mereduksi sejumlah data yang tidak dibutuhkan. Data reduction sangat berguna untuk mendapatkan atribut dan data yang akan digunakan dalam penelitian ini. Dalam penelitian ini atribut yang dibutuhkan adalah kecamatan asal mahasiswa, asal sekolah mahasiswa, dan IPK mahasiswa semester pertama dan kedua pada angkatan 2016 sampai dengan angkatan 2018.
Gambar 4.2 Tahapan Preprocessing Data Pada file pertama yaitu file data mahasiswa semua angkatan dari tahun 2016 sampai tahun 2018. Peneliti mereduksi atribut Nama, Program Studi, Tahun Akademik, Jenis Sekolah, dan Jurusan Sekolah karena atribut tersebut tidak begitu berpengaruh terhadap proses pengelompokkan data mahasiswa dalam penelitian ini dan data yang tidak direduksi peneliti adalah NIM mahasiswa, Alamat, dan asal sekolah mahasiswa. Sehingga proses reduksi mendapatkan data mahasiswa dengan angkatan 2016 sampai dengan angkatan 2018 berjumlah 3910 data mahasiswa. Pada file kedua yaitu adalah file data Indeks Prestasi Kumulatif (IPK) mahasiswa dari angkatan 2016 sampai angkatan 2018. Jumlah data mahasiswa yang didapat dalam file ini berjumlah 3910 data mahasiwa. File kedua ini berisikan beberapa kolom yaitu kolom NIM, tahun semester, dan IPK. Setelah peneliti menganalisis file data tersebut peneliti mereduksi
47
sejumlah data mahasiswa angkatan tersebut yang tidak dibutuhkan dalam penelitian ini.
Gambar 4.3 Tahapan Data Reduction
4.1.2 Data Cleaning Data cleaning adalah proses untuk mengisi missing value atau isian yang hilang atau kurang pas, mengoreksi data yang tidak konsisten, dan mendeteksi redudansi data yaitu penumpukan data atau duplikasi data. Peneliti melakukan proses data cleaning dengan aplikasi Microsoft Excel dengan cara memfilter setiap kolom dan mencari data yang kosong atau missing. Pada file data pertama yang sudah melewati proses data reduction berisikan 3910 data mahasiswa angkatan 2016 sampai dengan angkatan 2018.
48
Pada beberapa kolom terdapat data yang kosong, sejumlah satu data dan peneliti menambahi data tersebut dengan berdasarkan kolom lainnya. Selain terdapat data yang kosong atau blank terdapat juga data yang kurang sesuai dalam penulisan, maka peneliti mengubah data yang tidak konsisten tersebut menjadi data yang konsisten dan menghasilkan data yang berkualitas. Pada file kedua yang sudah melewati proses data reduction tentang indeks prestasi kumulatif berisikan sejumlah 3910 data. Setelah dianalisa terdapat data angka yaitu IPK mahasiswa dengan format yang kurang pas yaitu dengan format general maka peneliti mengganti format tersebut ke dalam format angka desimal. Selain data IPK, peneliti juga mengganti format pada data NIM Mahasiswa UNISNU ke format number karena data asli yang didapatkan menggunakan format general.
4.1.3 Data Transformation Data transformation adalah proses mengubah suatu data supaya mendapatkan data yang lebih berkualitas atau sesuai dengan kebutuhan. Dalam proses ini peneliti hanya akan melakukan proses transformation data pada file pertama dan file kedua. File yang pertama adalah file tentang data mahasiswa angkatan 2016 sampai dengan angkatan 2018. Setelah file pertama melewati proses data reduction dan data cleaning peneliti sudah mendapatkan atribut sesuai dengan kebutuhan dalam penelitian untuk memenuhi kondisi atau syarat yang cocok untuk dilanjutkan ke dalam proses algoritma K-Means Clustering. Dalam proses algoritma K-Means Clustering data yang bisa diolah hanya data yang berupa angka sedangkan data yang ada pada atribut kecamatan asal mahasiswa dan asal sekolah mahasiswa adalah data yang berupa text sehingga peneliti harus mengubah data tersebut kedalam angka agar bisa dilanjutkan ke dalam proses K-Means Clustering.
49
Langkah pertama yang dilakukan peneliti adalah mencari frekuensi atau jumlah data yang sama di setiap atribut lalu mengurutkannya dari frekuensi tersebar sampai ke terkecil dan memisahkannya kedalam tabel yang berbeda. Setelah itu peneliti memberi inisial pada setiap data berdasarkan frekuensi terbesar ke terkecil tujuannya adalah frekuensi yang paling besar nilainya merupakan data yang paling banyak muncul maka inisial dimulai dari frekuensi terbanyak. Peneliti membuat sebuah fungsi pada aplikasi Microsoft Excel, sebagai berikut: =VLOOKUP(B2,$F$2:$G$17,2,FALSE)
Gambar 4.4 Proses Inisialisasi Data Kecamatan Asal di Microsoft Excel Sehingga pada atribut kecamatan asal mahasiswa didapatkan 16 data dengan frekuensi dan inisial sebagai berikut:
50
Table 4.1 Inisialisasi Data Kecamatan Asal Kecamatan Asal
Frekuensi
Inisial
Bangsri
488
1
Batealit
443
2
Donorojo
94
3
Jepara
642
4
Kalinyamatan
128
5
Kedung
282
6
Keling
94
7
Kembang
115
8
Mayong
88
9
Mlonggo
360
10
Nalumsari
47
11
PakisAji
212
12
Pecangaan
227
13
Tahunan
472
14
Welahan
84
15
Luar Kecamatan Jepara
115
16
Pada atribut asal sekolah peneliti membuat sebuah fungsi pada aplikasi Microsoft Excel, sebagai berikut: =VLOOKUP(B2,$F$2:$G$7,2,FALSE)
51
Gambar 4.5 Proses Inisialisasi Data Asal Sekolah di Microsoft Excel Sehingga mendapatkan 5 data asal sekolah dengan frekuensi dan inisial sebagai berikut: Table 4.2 Inisialisasi Data Asal Sekolah Asal Sekolah
Frekuensi
Inisial
SMA
942
1
MA
1397
2
SMK
1470
3
PKBM
99
4
SKB
1
5
DLL
1
6
File kedua adalah data indeks prestasi sementara mahasiswa karena pada file data ini peneliti belum mendapatkan data yang diperlukan untuk proses selanjutnya yaitu IPK selama semester 1 dan semester 2. File data
52
kedua ini sudah melewati proses reduction dan proses data cleaning, sehingga data yang didapatkan adalah data mahasiswa angkatan 2016 sampai dengan angkatan 2018 dengan indeks prestasi sementara (IPS) selama 2 semester. Peneliti akan mengubah data tersebut menjadi indeks prestasi kumulatif selama 2 semester dengan menggunakan rumus: Rumus IPK Semester 2 =
đ??źđ?‘ƒđ?‘† đ?‘ đ?‘šđ?‘Ą 1 + đ??źđ?‘ƒđ?‘† đ?‘ đ?‘šđ?‘Ą 2 2
Setelah peneliti mendapatkan Indeks Prestasi Kumulatif selama 2 semester dengan rumus di atas peneliti mendapatkan sejumlah data yang bisa dilihat pada (Lampiran Tabel IPK Semester 2 angkatan 2016 sampai dengan angkatan 2018).
4.1.4 Data Integration Data integration atau integrasi data adalah suatu proses untuk menggabungkan data dari beberapa file sumber. Data integration ini hanya dilakukan apabila data yang akan diolah bersumber dari beberapa file sumber. Pada penelitian ini peneliti mengunakan 2 file excel yang digabungkan sesuai dengan kebutuhan penelitian menjadi satu tabel dan satu file agar mudah untuk diolah kedalam metode K-Means clustering. Setelah kedua data yang didapat melewati proses data reduction,data cleaning, dan data transformation maka langkah terakhir adalah menggabungkan atau mengintegrasi semua data tersebut menjadi satu dataset ke dalam suatu tabel.
53
Gambar 4.6 Proses Data integration Mahasiswa UNISNU Jepara 4.2
Penerapan Algoritma K-Means Clustering Setelah data mentah yang didapat dari pihak universitas diolah pada tahapan pre-processing dan sudah mendapatkan dataset yang siap untuk diolah maka tahap berikutnya adalah menerapkan algoritma K-Means Clustering pada dataset tersebut. Dalam penelitian ini peneliti menerapkan algoritma K-Means Clustering menggunakan dua aplikasi yaitu aplikasi Microsoft Excel dan aplikasi RapidMiner Studio. Peneliti menggunakan dua aplikasi tersebut bertujuan untuk membandingkan dan membuktikan bahwa aplikasi K-Means yang dibuat penelitian oleh peneliti mempunyai hasil yang sama dengan algoritma K-Means Clustering yang diterapkan menggunakan aplikasi Microsoft Excel dan aplikasi RapidMiner Studio. Urutan penerapan yang dilakukan peneliti adalah yang pertama menerapkan algoritma tersebut
54
menggunakan aplikasi Microsoft Excel 2019 kemudian menerapkannya menggunakan aplikasi RapidMiner Studio.
4.3
Penerapan Algoritma menggunakan Microsoft Excel 2019 Penerapan algoritma K-Means Clustering menggunakan Microsoft Excel 2019 membutuhkan beberapa tahapan proses sebagai berikut: 1. Menentukan Titik Pusat Cluster Titik pusat cluster atau bisa disebut centroid digunakan sebagai nilai pengurang untuk perhitungan jarak antara data ke setiap cluster atau disebut distance. Dalam proses ini penentuan nilai titik pusat cluster bisa ditentukan dengan metode acak sesuai keinginan peneliti dengan syarat nilai centroid masih termasuk dalam range nilai data pada setiap atribut. Selain itu penentuan nilai titik pusat cluster bisa ditentukan dengan menggunakan nilai rata-rata disetiap atribut. Dalan proses ini peneliti menentukan nilai titik pusat cluster menggunakan nilai rata-rata dari setiap atribut dataset yaitu kecamatan asal mahasiswa, asal sekolah mahasiswa, dan IPK mahasiswa. Nilai rata-rata pada setiap atribut tersebut dipakai sebagai nilai centroid pada cluster 2. Nilai rata-rata didapatkan dengan menjumlahkan nilai data pada setiap atribut kemudian dibagi dengan jumlah data yang ada. Nilai yang didapatkan adalah pada atribut kecamatan asal mahasiswa adalah 7,264, asal sekolah mahasiswa 2,187, dan IPK mahasiswa adalah 3,34. Lalu untuk mengisi nilai centroid pada cluster satu dan cluster tiga peneliti menentukan nilai centroid tersebut berdasarkan nilai centroid pada cluster dua yaitu nilai cluster satu kurang dari nilai cluster dua sedangkan nilai cluster tiga lebih tinggi dari nilai cluster dua. Sehingga peneliti mendapatkan nilai titik pusat setiap cluster / nilai centroid adalah sebagai berikut:
55
Table 4.3 Titik Pusat Awal Setiap Cluster
Kecamatan Asal
Asal Sekolah
IPK
Cluster 1
15
2
3,674
Cluster 2
16
2
3,227
Cluster 3
4
3
3,262
Titik Pusat
2. Menghitung Jarak Data ke Setiap Cluster Setelah mendapatkan nilai titik pusat setiap cluster proses selanjutnya adalah menghitung jarak data ke setiap cluster atau bisa disebut distance. Cara untuk menghitung nilai jarak atau distance tersebut peneliti menggunakan sebuah rumus Euclidean Distance, peneliti membuat sebuah fungsi dengan cara perhitungan yang sama dan menyesuaikan format yang berjalan pada aplikasi Microsoft Excel 2019. Perubahan rumus tersebut adalah sebagai berikut: = SQRT(((data pertama Kecamatan asal – centroid Kecamatan
asal)^2 )+ ((data pertama asal sekolah – centroid asal sekolah)^2 )+ ((data pertama IPK – centroid IPK)^2 ))
Keterangan: a. SQRT adalah fungsi akar pada Microsoft Excel b. Data pertama pada setiap atribut adalah kolom pertama data pada setiap atribut c. Centroid bisa berubah disesuaikan dengan cluster masingmasing, berikan absolute pada kolom centroid untuk membuat nilai tersebut tidak berubah – ubah jika didrag kebawah
56
d. Simbol ^2 adalah pangkat 2
Gambar 4.7 Menghitung Jarak Data Ke Setiap Cluster di Excel Hasil perhitungan jarak pada proses ini dapat dilihat dalam (Lampiran Tabel Perhitungan Jarak Data ke Setiap Cluster (Ms.Excel))
3. Mengalokasikan Data ke dalam Cluster Setelah proses perhitungan jarak data ke setiap cluster selesai maka proses berikutnya adalah mengalokasikan data kedalam setiap cluster yang terbentuk. Pengalokasian data tersebut berdasarkan hasil jarak antara data ke setiap cluster, apabila nilai jarak antara data pertama ke cluster 1 lebih kecil daripada nilai jarak antara data pertama ke cluster 2 ataupun cluster 3 maka data pertama masuk kedalam cluster 1. Pengalokasian data ini dilakukan bertujuan agar bisa menentukan titik pusat cluster baru pada proses selanjutnya. Dalam proses ini peneliti mengalokasikan data menggunakan fungsi IF pada Microsoft Excel, fungsi tersebut adalah sebagai berikut: = IF (nilai hasil jarak data pertama ke cluster satu<nilai dari hasil
jarak data pertama ke cluster dua;IF(nilai dari hasil jarak data
57
pertama ke cluster satu<nilai hasil jarak data pertama ke cluster tiga;"ok";"");"")
Keterangan: a. Fungsi tersebut diposisikan pada kolom setelah kolom perhitungan jarak data ke cluster dan baris data pertama. b. Fungsi IF adalah fungsi dalam Microsoft Excel untuk menentukan nilai dengan suatu kondisi tertentu. Maksud dari fungsi diatas adalah jika kolom U3 (nilai dari hasil jarak data pertama ke cluster 1) lebih kecil dari kolom V3 (nilai dari hasil jarak data pertama ke cluster 2) dan lebih kolom U3 lebih kecil dari kolom nilai hasil jarak data pertama ke cluster 3 maka ok (data pertama masuk ke cluster 1).
Gambar 4.8 Mengalokasikan Data ke dalam Cluster di Excel
4. Menentukan Titik Pusat Cluster Baru Setelah proses pengalokasian data sudah selesai maka tahapan selanjutnya adalah menentukan titik cluster baru. Penentuan centroid baru ini menggunakan metode yang hampir sama dengan menentukan titik pusat
58
cluster pada tahapan sebelumnya, yang membedakan dari kedua tahapan tersebut adalah dari jumlah data yang digunakan. Dalam tahapan ini centroid dapat ditentukan dengan cara menghitung nilai rata-rata sesuai dengan data yang sudah dikelompokkan kedalam setiap cluster masing- masing (tahapan pengalokasian data). Dalam proses ini peneliti mencari nilai rata-rata berdasarkan data yang sudah dikelompokkan ke setiap cluster masing-masing dan mendapatkan hasil sebagai berikut: Pada cluster 1 dengan jumlah data 1407 data Table 4.4 Tabel Centroid Baru (Cluster 1) TITIK PUSAT CLUSTER BARU Kecamatan Asal
12,466
Asal Sekolah
2,181
IPK
3,342
IPK
3,342
IPK
3,342
Pada cluster 2 dengan jumlah data 118 data Table 4.5 Tabel Centroid Baru (Cluster 2) TITIK PUSAT CLUSTER BARU Kecamatan Asal
12,466
Asal Sekolah
2,181
Pada cluster 3 dengan jumlah data 2385 data Table 4.6 Tabel Centroid Baru (Cluster 3) TITIK PUSAT CLUSTER BARU Kecamatan Asal
12,466
Asal Sekolah
2,181
5. Memverifikasi Titik Pusat Cluster Proses ini adalah tahap untuk memverifikasi titik pusat cluster. Proses tersebut adalah proses untuk memverifikasi antara titik pusat cluster baru
59
dengan titik pusat cluster yang lama, apabila kedua titik pusat cluster tersebut mempunyai nilai centroid yang berbeda maka proses K-Means Clustering masih berlanjut dan akan dimulai lagi pada proses ke-2 yaitu (menghitung jarak data ke setiap cluster) dengan menggunakan titik pusat cluster yang baru. Sedangkan jika nilai kedua centroid tersebut bernilai sama maka proses K-Means Clustering berhenti sampai di tahap tersebut. Proses verifikasi ini dilakukan dengan tujuan untuk menentukan apakah proses K-Means Clustering sudah selesai atau masih perlu dilakukan perulangan proses kembali. Dalam proses ini peneliti melalui 7 tahapan proses pengulangan untuk mendapatkan nilai titik pusat cluster atau centroid yang sudah tidak berubah lagi.
Gambar 4.9 Verifikasi Data Centroid (Microsoft Excel)
60
4.5.2 Hasil Penerapan K-Means menggunakan Microsoft Excel 2019 Setelah melewati tahapan proses K-Means Clustering menggunakan aplikasi Microsoft Excel 2019 maka proses berikutnya adalah menampilkan hasil dari penerapan tersebut. Untuk mendapatkan hasil yang diolah menggunakan algoritma K-Means Clustering peneliti melewati perulangan tahapan proses sebanyak 7 kali proses. Hasil dari penerapan ini adalah sebagai berikut: Table 4.7 Hasil Cluster 1 Penerapan Algoritma K-Means Clustering (Microsoft Excel) HASIL CLUSTER 1 CLUSTER 1 TERDIRI DARI 709 MAHASISWA YANG BERASAL DARI Kecamatan Asal
Asal Sekolah
Keling
94
SMA
181
Kembang
116
MA
250
Mayong
90
SMK
256
Mlonggo
361
PKBM
22
Nalumsari
48
TOTAL
709
709
Berdasarkan hasil cluster 1 dapat diketahui terdapat 709 data mahasiswa. Dalam tabel tersebut terdapat informasi tentang persebaran wilayah kecamatan asal maupun asal sekolah mahasiswa beserta dengan jumlah dari masing-masing kecamatan asal dan asal sekolah tersebut. Jumlah data mahasiswa pada cluster 1 adalah jumlah data yang paling sedikit dibandingkan dengan cluster yang lain. Informasi yang menonjol dari cluster 1 adalah informasi mengenai persebaran wilayah kecamatan asal mahasiswa.
61
Berdasarkan hal tersebut dapat diketahui bahwa kecamatan asal dengan frekuensi paling sedikit adalah kecamatan yang kurang diminati untuk masuk di Universitas Islam Nahdlatul Ulama Jepara. Table 4.8 Hasil Cluster 2 Penerapan Algoritma K-Means Clustering (Microsoft Excel) HASIL CLUSTER 2 CLUSTER 2 TERDIRI DARI 1116 MAHASISWA YANG BERASAL DARI Kecamatan Asal Bangsri
Asal Sekolah 1
SMA
268
Luar Kecamatan Jepara
115
MA
401
Pakis Aji
212
SMK
410
Pecangaan
228
PKBM
37
Tahunan
476
Welahan
84
TOTAL
1116
1116
Berdasarkan hasil cluster 2 dapat diketahui bahwa terdapat 1116 data mahasiswa. Jumlah data mahasiswa pada cluster 2 adalah jumlah data yang kurang dari cluster 3 tetapi lebih dari cluster 1. Informasi yang menonjol dari cluster 2 adalah informasi mengenai persebaran asal sekolah mahasiswa yaitu banyaknya jumlah jurusan asal sekolah yang berbeda beda dengan frekuensi yang berbeda pula. Berdasarkan hal tersebut dapat diketahui bahwa jurusan asal sekolah dengan frekuensi paling sedikit adalah asal sekolah yang kurang meminati untuk masuk di Universitas Islam Nahdlatul Ulama Jepara.
62
Table 4.9 Hasil Cluster 3 Penerapan Algoritma K-Means Clustering (Microsoft Excel) HASIL CLUSTER 3 CLUSTER 3 TERDIRI DARI 2085 MAHASISWA YANG BERASAL DARI Kecamatan Asal
Asal Sekolah
Bangsri
490
SMA
493
Batealit
446
MA
746
Donorojo
94
SMK
804
Jepara
643
PKBM
40
Kalinyamatan
129
SKB
1
Kedung
283
DLL
1
TOTAL
2085
2085
Berdasarkan hasil cluster 3 dapat diketahui terdapat 2085 data mahasiswa. Dalam tabel tersebut terdapat informasi tentang persebaran wilayah kecamatan asal mahasiswa maupun asal sekolah mahasiswa beserta dengan jumlah dari masing-masing kecamatan asal dan asal sekolah tersebut. Jumlah data mahasiswa pada cluster 1 adalah jumlah data yang paling banyak diantara cluster yang lain sehingga dapat dikatakan bahwa mayoritas mahasiswa UNISNU paling banyak masuk ke dalam kelompok cluster 1. Berdasarkan hal tersebut pihak admisi dapat mempertimbangkan strategi promosi di tahun depan menggunakan hasil persebaran wilayah dan asal sekolah pada cluster 3.
63
4.4
Evaluasi Dalam eksperimen data UNISNU Jepara, data mahasiswa angkatan 2016 sampai angkatan 2018, pasti memiliki nilai error, semakin kecil nilai error yang dimiliki pada hasil perhitungan maka semakin bagus pula hasil yang akan didapatkan. Pada penelitian ini menghitung nilai error menggunakan persamaan yang pada sebelumnya sudah dijelaskan, perhitungan nilai error terdapat pada proses berikut ini:
4.4.1 Pengujian Metode BCV dan WCV 1. Menentukan iterasi keberapa akan dihitung Untuk menentukan iterasi diambil pada iterasi terakhir karena iterasi terakhir memiliki kualitas centeroid yang lebih baik dari sebelumnya, pada penelitian ini menggunakan data perhitungan dari data mahasiswa UNISNU angkatan 2016 sampai angkatan 2018, untuk lebih jelasnya dapat Tabel di bawah ini. Table 4.10 Nilai Centroid pada iterasi terakhir Titik Pusat Kecamatan Asal
Asal Sekolah
IPK
Cluster 1
9,22
2,02
3,32
Cluster 2
13,70
2,03
3,33
Cluster 3
3,16
1,99
3,35
Kemudian hitung nilai Centroid dengan persamaan Between-Class Variation (BCV). BCV = √(9,22 − 13,70)2 + (2,02 − 2,03)2 + (3,32 − 3,33)2 + BCV = √(9,22 − 3,16)2 + (2,02 − 1,99)2 + (3,32 − 3,35)2 +
64
BCV = â&#x2C6;&#x161;(13,70 â&#x2C6;&#x2019; 3,16)2 + (2,03 â&#x2C6;&#x2019; 1,99)2 + (3,33 â&#x2C6;&#x2019; 3,35)2 BCV = 21,09 2. Menentukan jarak minimum centeroid Pada proses ini menggunakan jarak minimum pusat centeroid yang didapat pada iterasi terakhir, dapat dilihat pada tabel 4.10 Setelah mendapatkan jarak minimum dengan nilai pusat centroid maka langkah selanjutnya menghitung seluruh jarak minimum dengan persamaan WithinClass Variation (WCV) sebagai berikut: WCV = 0,222 + 2,392 + 1,582 + 1,282 +. . . +2,382 + 0,522 Sehingga hasil yang didapat adalah WCV = 12211,29 3. Menghitung perbandingan BCV dengan WCV Pada langkah terakhir adalah menghitung nilai perbandingan BCV dengan WCV sehingga menghasilkan nilai error hitung dengan persamaan Rasio seperti terlihat pada hasil dibawah ini. Rasio =
21,09 12211,29
= 0,0017
Untuk menentukan bagus atau tidaknya hasil pengujian dari nilai rasio yang didapat maka harus memperhatikan kriteria pengukuran rasio, dapat dilihat pada tabel 2.6. Hasil pengujian menggunakan perbandingan BetweenClass Variation (BCV) dan Within-Class Variation (WCV) mendapatkan nilai rasio yang tidak tinggi yaitu 0,0017 dan artinya tingkat penggunaan nilai sample data Centroid memiliki kualitas yang baik.
4.4.2 Pengujian Metode ROC Metode ROC digunakan untuk menghitung nilai akurasi hasil clustering yang telah diproses oleh sistem. Selain nilai akurasi, nilai sensifitas dan nilai spesifitas dapat dihitung juga. Adapun untuk mencari nilai akurasi
65
dapat dicari dengan persamaan akurasi, untuk mencari nilai sensifitas dengan persamaan sensifitas, dan mencari nilai spesifitas dengan persamaan spesifitas. Pada penelitian ini adalah data dari hasil clustering data mahasiswa angkatan 2016 sampai angkatan 2018 yang berupa data nilai centeroid awal dan nilai centeroid pada iterasi terakhir. Data tersebut ditampilkan dalam tabel 3.7 di bawah ini. Table 4.11 Nilai Centroid pada iterasi terakhir
Titik Pusat
Centroid Awal
Centroid Iterasi Terakhir
Cluster 1
3,67
3,32
Cluster 2
3,23
3,33
Cluster 3
3,26
3,35
Akurasi
=
Sensifitas = Spesifitas =
3,67+3,32 3,67+3,32+3,26+3,35 3,67 3,67+3,35 3,67 3,67+3,26
= 0,51
= 0,52 = 0,53
Sesuai dengan perhitungan nilai akurasi yang didapat adalah 0,51. Nilai akurasi ini berada dalam kategori baik berdasarkan referensi pada tabel 3.8 dibawah ini. Table 4.12 Standar Receiver Operating Characteristic (ROC) Nilai Rasio
Kategori
0,80-1,00
Sangat baik
0,60-0,80
Baik
0,40-0,60
Cukup Baik
0,20-0,40
Kurang Baik
0,00-0,20
Tidak Baik
66
4.5
Penerapan Algoritma menggunakan Rapidminer Studio RapidMiner merupakan software/perangkat lunak untuk pengolahan data. Dengan menggunakan prinsip dan algoritma data mining, RapidMiner mengekstrak pola-pola dari data set yang besar dengan mengkombinasikan metode statistika, kecerdasan buatan dan database. RapidMiner memudahkan penggunanya dalam melakukan perhitungan data yang sangat banyak dengan menggunakan operator-operator. Operator ini berfungsi untuk memodifikasi data. Data dihubungkan dengan node-node pada operator kemudian menghubungkannya ke node hasil untuk melihat hasilnya. Hasil yang diperlihatkan RapidMiner pun dapat ditampilkan secara visual dengan grafik. Menjadikan RapidMiner adalah salah satu software pilihan untuk melakukan ekstraksi data dengan metode-metode data mining. Pada penelitian ini, dataset yang akan diimpor ke dalam Rapidminer adalah dataset yang dibuat dengan aplikasi Microsoft Excel, kemudian pilih file yang akan digunakan. Setelah file itu diimpor, kemudian tentukan masing-masing indikator atribut yang terdapat di dalamnya. Karena semua atribut berisi lebih dari dua klasifikasi maka tipe dari atribut tersebut adalah polynominal.
67
Pada Gambar 4.10 di bawah ini dapat dilihat cara pengaturan dataset dalam melakukan impor ke dalam tool RapidMiner.
Gambar 4.10 Proses Impor Dataset kedalam RapidMiner Peneliti membuat desain clustering menggunakan algoritma K-Means seperti yang ditunjukkan pada Gambar 4.11
Gambar 4.11 Desain Clustering Menggunakan Algoritma K-Means
68
Pada Gambar 4.11 dapat dilihat bahwa proses pengujian dimulai dengan retrive data Mahasiswa UNISNU 2016-2018, artinya dataset disimpan dengan nama Data Mahasiswa 2016-2018. Dataset itu kemudian disambungkan terlebih dahulu ke Transform to Numerical sebelum dilakukan pengujian
menggunakan
Algoritma
K-Means
Clustering.
Setelah
disambungkan ke Algoritma K-Means Clustering maka selanjutnya disambungkan lagi ke Apply Model, lalu ke Performance dan terakhir disambungkan ke Result. Setelah pengujian berjalan maka didapatkan informasi bahwa lama waktu pemrosesan clustering dengan Algoritma KMeans, seperti yang tercatat pada Gambar 4.12.
Gambar 4.12 Result History menggunakan Algoritma K-Means Clustering
Hasil dari nilai Davies Bouldin Index (DBI) dan deskripsi Performance yang menghasilkan Centroid Distance pada setiap cluster dapat dilihat pada Gambar 4.13.
69
Gambar 4.13 Centroid Distance K-Means Clustering
Pada penelitian ini cluster yang digunakan berjumlah 3, dimulai dari cluster 0 dan diakhiri dengan cluster 2, sesuai dengan pendefinisian nilai k dengan jumlah cluster 0 adalah 1043 items, cluster 1 adalah 1470 items, cluster 2 adalah 1397 items dengan total dataset yang di clustering sebanyak 3910 items pada tiap-tiap cluster.
Gambar 4.14 Hasil Cluster Model K-Means
70
Berikut ini hasil perhitungan antara jarak cluster dengan centroid menggunakan RapidMiner Studio.
Gambar 4.15 Hasil Perhitungan Antara Jarak cluster dengan centroid menggunakan Rapid Miner Studio
71
Berikut ini hasil Hasil Set Cluster visualizations berdasarkan grafik scatter, grafik tersebut dapat dilihat pada Gambar 4.16.
Gambar 4.16 Hasil Set Clustering (Diagram Scatter)
Berdasarkan dari hasil penelitian yang telah dilakukan pada data mahasiswa UNISNU Jepara angkatan 2016-2018. Selain menggunakan perhitungan manual dengan bantuan software microsoft excel juga dilakukan perhitungan dengan software data mining menggunakan RapidMiner Studio,
72
sebagai perbandingan hasil yang didapat perhitungan ini adalah sebagai berikut: Table 4.13 Perbandingan Hasil Perhitungan Perbandingan
Perhitungan Manual
Perhitungan RapidMiner
Jumlah Literasi
7
-
C1
C2
C3
C1
C2
C3
709
1116
2085
1043
1470
1397
Jumlah Cluster
Jumlah Centroid Jumlah Nilai Rasio
3 18,1%
28,5%
3 53,3%
26,7%
37,6%
35,7%
BAB V PENUTUP
5.1
Kesimpulan Kesimpulan dalam penelitian ini adalah sebagai berikut: Penelitian ini menerapkan metode algoritma K-Means Clustering menggunakan dua aplikasi yaitu Microsoft Excel 2019 dan Aplikasi RapidMiner Studio. Dari penelitian yang telah diolah menggunakan metode k-means clustering dengan menggunakan aplikasi Microsoft Excel 2019 dan Aplikasi RapidMiner Studio didapatkan hasil bahwa mahasiswa angkatan 2016 sampai 2018 yang dibagi menjadi 3 cluster. Cluster 1 adalah kelompok dengan cukup peminat yaitu berasal dari kecamatan Mlonggo berjumlah 361 mahasiswa dan untuk asal sekolah berasal dari SMK dengan jumlah 256 mahasiswa. Pada cluster 2 kelompok dengan cukup peminat yaitu berasal dari kecamatan Tahunan berjumlah 476 mahasiswa dan untuk asal sekolah berasal dari SMK dengan jumlah 410 mahasiswa. Dan cluster 3 kelompok dengan banyak peminat yaitu berasal dari kecamatan Jepara berjumlah 643 mahasiswa dan untuk asal sekolah berasal dari SMK dengan jumlah 804 mahasiswa. Maka, kelompok yang perlu mendapatkan prioritas utama dari pihak Universitas adalah kelompok yang berada pada cluster 3. Sehingga dari penelitian ini untuk strategi promosi bagi calon mahasiswa baru Universitas Islam Nahdlatul Ulama Jepara nantinya akan mengikuti cluster yang terbentuk bardasarkan perhitungan K-Means Clustering, yaitu cluster yang paling banyak dari Kecamatan Asal dan Asal Sekolah mahasiswa. Agar nantinya tidak terjadi penurunan jumlah mahasiswa pada tahun berikutnya.
73
74
5.2
Saran Saran yang dapat peneliti berikan untuk penelitian lebih lanjut: 1. Meningkatkan kecepatan cara memproses perhitungan dalam sistem KMeans Clustering. Dengan sebuah aplikasi agar nantinya hasil dari perhitungan dapat langsung ditampilkan. 2. Menambahkan atribut atau parameter data dalam penelitian ini dan menambahkan atau mengupdate data mahasiswa di UNISNU Jepara. 3. Mengkomparasikan algoritma K-Means dengan algoritma lain dalam mengcluster sebuah data.
DAFTAR PUSTAKA
[1]
I. Kurniawati, R. E. Indrajit, and M. Fauzi, “Peran Bussines Intelligence Dalam Menentukan Strategi Promosi Penerimaan Mahasiswa Baru,” J. Komput. dan Inform., vol. 1, no. 2, pp. 70–79, 2017.
[2]
M. Arifin, “Business Intelligence Untuk Customer Churn Telekomunikasi,” Pros. SNATIF, no. 1, pp. 279–286, 2014.
[3]
H. Islam and M. Haque, “An Approach of Improving Student’s Academic Performance by using K-means clustering algorithm and Decision tree,” Int. J. Adv. Comput. Sci. Appl., 2012.
[4]
Nor Syazwani Rasid and N. Ahmad, “Grouping Students Academic Performance Using One-Way Clustering,” 2014.
[5]
E. Sugiharti and M. A. Muslim, “On-line clustering of lecturers performance of computer science department of semarang state university using KMeansAlgorithm,” J. Theor. Appl. Inf. Technol., 2016.
[6]
Mardalius, “Implementasi Algoritma K-Means Clustering Untuk Menentukan Kelas Kelompok Bimbingan Belajar Tambahan,” Teknol. Mob., p. 105, 2017.
[7]
Andi Wijanarko, “Penerapan Data Mining Untuk Menentukan Strategi Promosi Universitas Pgri Yogyakarta Menggunakan Algoritma K-Means Clustering,” vol. 62, no. 1, pp. 27–40, 2016.
[8]
Akhmad Choerudin Wakhid, “Implementasi Data Mining Menggunakan Algoritma K- Means Clusterinng Untuk Mengetahui Pola Pemilihan Program Studi Mahasiswa Baru Iain Salatiga,” vol. 102, no. 4, pp. 24–25, 2017.
[9]
“Bussiness Intelligence Environment,” 2015. [Online]. Available: https://www.learnbi.com/blog/business-intelligence-environment/.
[10]
Z. Tang, J. Maclennan, and P. P. Kim, “Building Data Mining solutions with OLE DB for DM and XML for Analysis,” in SIGMOD Record, 2005.
[11]
I. H. Witten, E. Frank, and M. a. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Third Edition. 2011.
[12]
D. T. Larose, Discovering Knowledge in Data: An Introduction to Data Mining. 2005.
[13]
J. Han and M. Kamber, Data Mining Concept and Tehniques. 2006.
[14]
Emha Taufiq Luthfi, Penerapan Data Mining Algoritma Asosiasi Untuk Meningkatkan Penjualan. 2009.
[15]
M. T. Mukhammad Yunan Helmy, Drs. Kushartantya M.Ikomp, Nurdin 75
76
Bahtiar S.Si., “Implementasi Data Mining Untuk Memprediksi Kelayakan Permintaan Pinjaman Nasabah Di Lembaga Keuangan,” vol. 2, no. 1, pp. 267–274, 2013. [16]
Agus Nur Khormarudin, “Teknik Data Mining : Algoritma K-Means Clustering,” pp. 1–12, 2016.
[17]
Dosen Pendidikan 3, “Data Mining,” 2019. [Online]. Available: https://www.dosenpendidikan.co.id/metode-data-mining/.
[18]
R. D. Ramadhani, “Data Mining Menggunakan Algoritma K-Means Clustering Untuk Menentukan Strategi Promosi Universitas Dian Nuswantoro,” Ind. Mark. Manag., vol. 1, no. 1, pp. 1–9, 2014.
[19]
R. K. Daniel and S. Eko, “Penentuan Alih Fungsi Lahan Marginal Menjadi Lahan Pangan Berbasis,” JdC, vol. 2, no. 2, pp. 18–25, 2013.
[20]
A. M. Siregar, “Penerapan Algoritma K-Means Untuk Pengelompokan Daerah Rawan Bencana Di Indonesia,” Intern. (Information Syst. Journal), vol. 1, no. 2, pp. 1–10, 2019.
[21]
J. E. Gentle, L. Kaufman, and P. J. Rousseuw, “Finding Groups in Data: An Introduction to Cluster Analysis.,” Biometrics, 1991.
[22]
C. Vercellis, Business Intelligence: Data Mining and Optimization for Decision Making. 2009.
LAMPIRAN
LAMPIRAN A Tabel IPK Semester 2 angkatan 2016 sampai 2018 NO 1 2 3 4 5 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
NIM 161120001961 161230000141 161250000173 161310003556 161310003592 161110001799 161110001800 161110001801 161110001802 161110001803 161110001804 161110001805 161110001806 161110001807 161110001808 161110001809 161110001810 161110001811 161110001812 161110001813 161110001814 161110001815 161110001816 161110001817 161110001818 161110001819 161110001820 161110001821 161110001822 161110001823 161110001824 161110001826 161110001827 161110001828 161110001829
NAMA ALIF MIFTAKHUR RIZQIYYA MUIS DIYAH AYU HERWATI AHMAD NUR RIYAN SATRIA AHMAD SYAFI`I ROFIATUZ ZAHRO NUR QOMARIAH RYKI BUDI SUSANTO KURNIA INDRIYANI DAFA ABIAS APRILINO IKRIMA SALMA ASMA KARIMAH VIVI SUSI KURNIAWATI WAHYU SETIYAWAN VITA ARDIANASARI SITI ISTIQOMAH HAMIDATUN NASIHATI KHOIRUDIN AINUN NAJIB SEPTIAN YUDI PRADANA NOVAL FEBY KURNIAWAN ISNA MARLIA ULFAH INNAYATUL USRAK SITI LUTFIYAH LATIFATUL KHIDMAH ELIYANA WAHYUNINGSIH DEWI AISYAH A`ISYAH DWI RAHMAWATI MAHFUDIN DWIKA NURBENI DITA AINIA PUTRI MUHAMMAD JAMALUL INSAN NURUL HIDAYAH AHMAD NAITUL MUQID DEWI NOVITA SARI AMALASARI AFRISA TRIA UNIKA DESI ASTRIYANTI
77
TAHUN 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016
IPK 3.30 3.61 3.73 3.58 3.61 3.41 2.77 3.28 3.21 2.95 3.67 3.10 2.78 3.11 3.53 3.22 3.21 2.38 2.88 3.44 3.79 3.82 3.56 3.55 3.20 3.04 3.17 3.53 3.20 3.42 2.75 2.83 2.24 3.65 2.59
78
37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77
161110001831 161110001832 161110001833 161110001834 161110001835 161110001836 161110001837 161110001838 161110001839 161110001840 161110001842 161110001843 161110001844 161110001845 161110001846 161110001847 161110001848 161110001849 161110001850 161110001851 161110001852 161110001853 161110001854 161110001856 161110001857 161110001858 161110001859 161110001860 161110001861 161110001862 161110001863 161110001864 161110001865 161110001867 161110001868 161110001869 161110001870 161110001871 161110001872 161110001873 161110001874
SUGI JUMI LUKFIYANI SUTRISNO FARIDA UMMY ROSYIDAH M. MUTHO`IN FATIMAH NURUL HUSNAH IRA WAHYUNINGSIH FITRI NURMA ZUNITA SOFYAN IMANULLAH ARISTIYANINGSIH DENI ARIYANTO MUHAMMAD ANDI ABDULLAH MUFID TIARA ROSYADI BHAGAS VELANDYKA ANUNGGAL BAGAS SAPUTRO ELA RESITA DEVI NOR MUZDALIFAH PANDU SETIAWAN MUHAMMAD KHARISUL HAQ IMANDA AYU RACHMAWATI NURUL KHIKMAH YAFQI FIRLANA RITA YULIANA AHMAD WILDAN AHMAD AIFAL MUALLIF RIYAN ANDI SAPUTRA RISKA ARISTIANTIKA ZULFI FADILA AFIROHANISA ZUQNIAUTIKA RAHMA FARADITA NILASARI PUTRI RISKA NURUL HUDA LIYA ROSA RISHA KHABIBATUN NI NANDA OKTASAVIRA BUDI ARIS SANDI ACHMAD ASHIF OKTAVIA WAHYU ARI S ALVI LATIFAH TRI ABELLA VISTYA NINGRUM ISNAINI NOVIA RANI ULUL AZMIA
2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016
3.20 3.13 3.15 2.02 3.21 3.48 3.33 3.07 2.81 3.28 2.68 3.22 2.99 3.05 3.21 3.50 3.55 2.88 2.79 3.50 3.30 3.18 3.46 2.90 3.08 2.89 3.04 3.41 3.13 2.98 2.83 3.02 3.84 3.31 2.99 2.48 2.47 3.09 3.48 3.15 3.40
79
78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118
161110001875 161110001876 161110001879 161110001880 161110001881 161110001882 161110001883 161110001884 161110001885 161110001886 161110001887 161110001888 161110001889 161110001890 161110001891 161110001892 161110001893 161110001895 161110001897 161110001898 161110001899 161110001900 161110001901 161110001902 161110001903 161110001904 161110001906 161110001907 161110001908 161110001909 161110001910 161110001911 161110001912 161110001913 161110001914 161110001915 161110001916 161110001917 161110001918 161110001919 161110001920
NOOR KHAMID AHMAD DEDDY EFENDI MUHAMMAD SYAIFUDDIN MAHMUD MUJIONO ALFINATUN NIKMAH ADITYA REZA DHANNY ESA LUVTI'ANY HERA ARVIANI MURYANA VIVIAN BAGUS SAPUTRA INDRI SEPTIANI SETYODI NINGRUM LIA SIFATUN NADHIRO PUPUNG YUNI ASTARA YASHINTA DWI SEPTIANI TARI MEGA ASTUTI FEBRI TRI UTARI MUHAMMAD IVAN FARDIANTO VINA MARKHATUN NISA LAILATUL FITRIYAH RAHARDIANTO WAHYU WIDODO RISQI WAHYU HIDAYAH YUSRIKHATUR RIZQIYAH NISAUN ARUM SARI ALIF WAHYUDI AHMAD SYARIFUL ADHKAR MUHAMMAD RIZKI JAZULI USWATUN KHASANAH RIZQI APRILIANA AULIA SARI NUR FAIJAH MOHAMMAD QOMAR SHERLY SANTANIA OKTAVIA HIJAYA NAPIAN AYU USTALIA INDAH DEWI TRI ANJANI RITA FATMALA PUSPA MUHAMMAD FAHMI WIWIN ARISTYANINGRUM AJENG PRASETYANINGTYAS MOHAMAD TAUFIK HANNY AMALLIYANA AGUS SUSANTO FITRIANA
2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016
2.89 2.71 3.46 3.37 3.18 3.60 3.16 2.89 2.86 2.98 3.40 2.98 3.22 3.15 3.21 3.16 3.05 3.27 3.01 2.64 3.56 3.00 2.01 2.52 1.69 3.16 2.87 3.27 2.91 3.06 2.59 3.04 3.39 3.54 3.25 2.74 3.86 2.38 3.09 2.92 2.90
80
119 120 121 122 123 124
161110001921 161110001922 161110001923 161110001924 161110001925 161110001926
125
161110001927
126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150
161110001928 161110001929 161110001930 161110001931 161110001932 161110001934 161110001935 161110001936 161110001937 161110001939 161110001940 161110001941 161110001942 161110001943 161110001944 161110001945 161110001946 161110001947 161110001948 161110001949 161110001950 161110001951 161110001952 161110001953 161110001954
…. 1163 1164 1165 1166 1167 1168 1169
…. 161510000350 161510000351 161510000352 171310003774 171340000032 171110002054 171110002057
ABDULLAH LUKMAN HAKIM SADAT ARDIANSYAH RIZKY RAMADHAN RAJA TAMA RISKA MILAWATI MAIUN ISROIL YANA IKRAR SEPTO RINO MUHAMMAD ROYKHAN RASHIF AULIA MUHAMMAD ZAINUR FARIHAH SULISTYA PUTRI EVA ALVIANA AJUN HARYADI MUHAMMAD CANDRA ADI PUTRA FERY ANGGA YAKARIM SHALMA OCTAVIANA PUTRI DYAH AYU KHOIRUL USTAZAH MIA AMALIA NIA SUSANTI PUTRI AULIA MUH FRENDI JUNIANTO JALIL AL HUSIEN IBNUHAR NOVI LUTFIANY ASTRI DELA REGAR NUR AKMAL MAULANA NIKMATUL HANIK JAYAN SETYADI AKHMAD SYAIKHURRAFIQ ANNA SAFITRI KHULAFAURRASYIDIN NOR SA`DIYAH RIDAYANTI SAIFUL ROHMAN TATAKING KINARDI HARYONO IKHSAN RUDI SUPRIYONO
…. SHIDQIYAH NURUL ANISA RISA NUR HIDAYAH LILIK KHUMAIROTUN NISA' ISTAFIDATUL MUSTAKHIROH EMILIA INTA ARGADEA VENNY AULIA ROHMAH
2016 2016 2016 2016 2016 2016 2016
2.93 2.50 2.18 3.26 1.48 2.66
2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016
2.66 2.80 3.56 3.16 3.05 3.17 2.65 3.08 3.20 3.43 3.21 2.81 2.05 3.21 3.20 3.16 2.98 2.83 3.31 3.54 3.22 3.34 3.06 2.95 3.19 2.27
….
….
2016 2016 2016 2017 2017 2017 2017
3.69 3.70 3.52 3.44 3.49 3.17 2.71
81
1170 1171 1172 1173 1174 1175 1176 1177 1178 1179 1180 1181 1182 1183 1184 1185 1186 1187 1188 1189 1190 1191 1192 1193 1194 1195 1196 1197 1198 1199 1200 1201 1202 1203 1204 1205 1206 1207 1208 1209 1210
171110002058 171110002059 171110002060 171110002061 171110002062 171110002063 171110002064 171110002065 171110002066 171110002068 171110002069 171110002071 171110002072 171110002073 171110002074 171110002075 171110002076 171110002078 171110002079 171110002080 171110002081 171110002082 171110002083 171110002084 171110002085 171110002086 171110002087 171110002088 171110002089 171110002090 171110002091 171110002092 171110002094 171110002095 171110002096 171110002097 171110002098 171110002099 171110002100 171110002101 171110002102
FANIA EKA KUMALA MUHAMMAD LUTFI ALDO ILHAM HADZAFI WIDIYAWATI AKHMAD SAFII TANTRI PRATIWI DWI HIDAYATI SAPUTRI ENDAH SYUFUFATUL MUNA ARINA ABIDATUN DWI JAYANTI PUTRI EKA AGUSTINA SHELY VEBRIANTI MUHAMMAD ADIB ZANUAR EKA AMBARWATI CANDRA FIRMANSYAH RIZKIYATUL MAULIDAH CHYATUNNUFUS OKTAVIRANA ERDIANA ROSANTI PONCO SETYO EDI MOHAMAD ABDURUN NAFIS HETY MAYANG FITRIANI HESTI NURAENI MUHAMAD ANDRYAN AHMAD AQILUL MUBAROK MUHAMMAD KHOIRUL ANAM LATIFAH SRI NURHAYATI M.SIDQON ADILLA KAMALUZ ZAMAN NU`MA SILFIANA HERI FAJAR SAPUTRA SHAFIRA ANINDITA RIANDINI DIAN NOR HALIZAH FAIRUZ HARIS FAHRURROZI ILHAM DIMAS KURNIAWAN DAFFAREL BYAN XAVIER AHMAD RIZA ARINAL HAQ ZAKIYAT NOR KHOLIFATUL FITRIYAH SRI HARTANTI AHMAD NUR FAIZIN DITYA WAHYU FIDIANTI ADELIZA LAILY FITRIASANDY
2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017
3.54 3.70 2.22 3.52 3.15 3.33 3.06 3.23 3.53 3.42 3.64 2.95 2.76 3.76 3.14 3.30 3.05 2.88 3.23 3.48 3.44 3.46 3.66 3.08 2.46 3.88 2.65 3.95 2.10 3.44 2.85 3.43 2.56 3.52 3.38 3.42 3.37 3.32 3.51 3.05 3.78
82
1211 1212 1213 1214 1215 1216 1217 1218 1219 1220 1221 1222 1223 1224 1225 1226 1227 1228 1229 1230 1231 1232 1233 1234 1235 1236 1237 1238 1239 1240 1241 1242 1243 1244 1245 1246 1247 1248 1249 1250 1251
171110002103 171110002104 171110002105 171110002106 171110002107 171110002108 171110002109 171110002110 171110002111 171110002112 171110002113 171110002114 171110002116 171110002117 171110002118 171110002119 171110002120 171110002121 171110002122 171110002123 171110002124 171110002125 171110002127 171110002128 171110002129 171110002130 171110002131 171110002132 171110002133 171110002134 171110002135 171110002136 171110002137 171110002138 171110002139 171110002140 171110002141 171110002142 171110002143 171110002144 171110002145
RANA ROSIDAH NURUL HIDAYAT SOFI NILA FADHILA SANIA SEPTI FEBRIANTI NIKEN AYU NINGTIYAS MUHAMMAD IRFAN RIRIS LUTFIYANI AHMAD NAJI MARIA ULFA EVI DYAH KUMALASARI NOVIA WULANNISMI FADILLA WAHYU SAFITRI ARFIAN DWI PUTRAWAN KHETRINE NADYA INTAN SAFILA MIR`ATUL AULIA WAHYUNI DURRROTUL MUSTAGFIIROH BAGUS ZUNI ARSENTA MUHAMMAD KHUSNUT TAKHARRI DIAH SAFITRI THORIQ AZIZ ZUHRON ULIL ABAB ROMY ABI RAMADHAN NOVITA APRILYANI PUTRI SAYIDAH ROHMATUL UMMAH YULI ASMAWATI RIZKY LINDA NUR A`ISYAH DITA PUTRI SAPIRA ENI RAHMAWATI ELVINA ASIKHATUL MAHYA WINDASARI ASTUTI ALDITIA YELA PRATAMA MUHAMMAD SABIQ ROMDHONI WILDAN ADHITYA RACHMAN TRISKA OKTAVIANI RENI NOVITA SARI DEWI NOVITASARI SAFIRA PRAVIDIANI SILFIA FEBRIANTI VIVI NOVITASARI AHMAD ZAKARIA
2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017
3.05 3.60 3.36 3.73 3.01 2.49 3.92 3.80 3.47 3.46 2.60 2.43 3.48 3.61 3.84 3.54 3.45 3.37 3.21 3.21 3.65 2.84 1.65 3.57 3.79 3.69 3.64 2.93 3.83 2.63 2.76 2.36 2.45 3.01 3.80 2.75 3.25 2.61 2.80 2.85 3.19
83
1252 1253 1254 1255 1256 1257 1258 1259 1260 1261 1262 1263 1264 1265 1266 1267 1268 1269 1270 1271 1272 1273 1274 1275 1276 1277 1278 1279 1280
…. 2528 2529 2530 2531 2532 2533 2534 2535 2536 2537 2538
171110002146 171110002147 171110002151 171110002152 171110002154 171110002155 171110002156 171110002157 171110002158 171110002159 171110002160 171110002161 171110002162 171110002163 171110002164 171110002165 171110002166 171110002169 171110002170 171110002171 171110002172 171110002173 171110002174 171110002175 171110002176 171110002177 171110002178 171110002179 171110002180
…. 171510000375 171510000377 171510000379 171510000380 181110002251 181110002252 181110002253 181110002254 181110002255 181110002256 181110002257
MAULIDA WAHYUNI YUSUF AHSAN ISTIKA CHAERUNNISA RONI ANJASMARA NUR ROHMAWANTI NUR FAUZIYAH FITALIA ISANDRA GHIRNIX MUAFFA GUNTUR PRASTYA ENGGAR TIYASTO LUKITO ALFIATUL ROHMANIA TYAS WIDY CAHYANTI AHMAD AINUR RIFQI SERLI NOVIANA SAPTA RISTIANDANI MAHESA YORDI TRIAWAN DELLA OKTAVERA MUHAMMAD AZHAR AN NAHIDH ZAINAL BABRUL MUJAHIDIN SEPTIAN DWI ARYANI SUSI NOR AMELIA NANANG ABDUL LATIEF DEWI SETYOWATI NINA AMILIA MOHAMAD FUAD HASAN IRZAK DWI FAJAR WIKA MEISYAFITRI MUHAMMAD SIROJUL MUNIR MUHAMMAD ATQO RIDHO DIORS FEBDALLEANA CELLINE P
…. FERY IRAWAN BUDIYANTO SITI FATIMAH NOOR WAKHIDAH WAHYUNI RAHMAWATI SARI UTAMI NANDA DIVA LATIEFANY RIZKY SETYA KHOIRUNNISA SHINTA WAHYU ADITYA LAILA FITRIA FARHANA YAYUK ICHA SUSANTI TAUFIK ARIS IRFAWAN
2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017 2017
3.34 3.75 2.89 2.49 3.68 3.44 3.40 3.32 3.04 2.64 3.35 3.50 3.33 2.77 2.48 3.42 2.49 2.89 3.65 3.70 3.29 1.14 1.88 2.99 2.69 3.58 3.04 2.43 3.80
….
….
2017 2017 2017 2017 2018 2018 2018 2018 2018 2018 2018
3.45 3.65 3.56 3.81 3.28 3.55 3.89 2.93 3.77 3.54 2.95
84
2539 2540 2541 2542 2543 2544 2545 2546 2547 2548 2549 2550 2551 2552 2553 2554 2555 2556 2557 2558 2559 2560 2561 2562 2563 2564 2565 2566 2567 2568 2569 2570 2571 2572 2573 2574 2575 2576 2577 2578 2579
181110002258 181110002259 181110002260 181110002261 181110002262 181110002263 181110002264 181110002265 181110002266 181110002267 181110002268 181110002269 181110002270 181110002271 181110002272 181110002273 181110002274 181110002275 181110002276 181110002277 181110002278 181110002279 181110002280 181110002281 181110002282 181110002283 181110002284 181110002285 181110002286 181110002287 181110002288 181110002289 181110002290 181110002291 181110002292 181110002294 181110002295 181110002296 181110002297 181110002299 181110002300
MUHAMMAD AMIRUDIN IHSAN APRINIA ZULIANI NIRMA YUNITA TRI SHINTA BELA RAHMAWATI FAISAL RIO HERMANSYAH DINIA VIOLA SARI NIMAS RURUH PURBANINGRUM TRIA PRATIWI ANNISA YASHINTA DEWI PUTRI FARID MA'RUF SINA SYARIF HIDAYATULLOH AHMAD FAIZUL MUQOFFA RISKA FITROTUL MUNAWAROH MUHAMMAD ZAQI NURROKHMAN KOSA FAUDI IMAWAN AHMAD EFENDI MUHAMMAD YUSRIL ALFAINI HALIDA MARIYATUL QIBTIAH ANWAR RAMADAN FAHRI MUHAMMAD DINDA LAILI SAVITRI DEVI AYU LESTARI ZELLA DANISWARA PUTRI IRMA YANTI KHOIRUL MUJIB MUHAMMAD ISNA MUHAIMIN FARID NOVITA SURYANI BAYU PAMUNGKAS JAZULIA KUSUMA PUTRI MIFTAKHUL MUFIDAH NUR MAULIDIYA KEVIN PRATAMA AULIA NUR ARIFAH SAFIRA SILFIANI ESA WINANDA ANJAS VICKY ARDIYANTO AKHMAD ROBBI NOVIYAN DIAH AYU DAMAYANTI NILA SAFITRI MUHAMMAD AFIF MAULANA IZZA DINA MAULINA
2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018
2.99 3.12 3.59 3.40 3.08 1.02 3.20 3.69 3.61 3.35 2.43 3.04 3.37 3.70 3.45 3.79 3.15 3.25 3.30 3.32 2.30 3.17 3.10 3.52 3.35 2.24 3.09 3.77 3.41 3.89 3.20 3.41 3.17 3.64 3.52 3.63 3.24 2.98 3.30 3.26 3.42
85
2580 2581 2582 2583 2584 2585 2586 2587 2588 2589 2590 2591 2592 2593 2594 2595 2596 2597 2598 2599 2600 2601 2602 2603 2604 2605 2606 2607 2608 2609 2610 2611 2612 2613 2614 2615 2616 2617
181110002301 181110002302 181110002303 181110002304 181110002305 181110002306 181110002307 181110002308 181110002309 181110002310 181110002311 181110002312 181110002313 181110002314 181110002315 181110002316 181110002317 181110002318 181110002319 181110002320 181110002321 181110002322 181110002324 181110002325 181110002326 181110002327 181110002328 181110002329 181110002330 181110002331 181110002333 181110002334 181110002335 181110002336 181110002337 181110002338 181110002339
181110002340 2618 181110002341
NOVIA GONING LARASATI AHMAD FERY ARDIANSYAH SEPTINA EKA NUGRAHENI ISFAINZAH BACHTIAR INDRA ALGHANI MUHAMMAD BURHANUDDIN HIDAYAT INDRA SAPUTRA KHAIZATUN NASIROH MUHAMMAD TAJUDIN FATKHUR SITI MUKHOYYAROH NURUL AKHIDAH SHOUCHY SHUYEN MAY CINDI FERDIANI ALIF YOSEF FANI AXEL BAHTIAR ADI AVRINDO MUHAMMAD ALDI SETIYAWAN EDI KURNIAWAN SILVIA LARASATI MUHAMAD SAIFUL BACHTIYAR MUKHAMMAD SONUR WIBOWO ADELA INTAN KISMIA AFAFI TSABITA ALFI RAHMA IVANDIKA YAHYA ALFIANTO DIMAS IHTIYAR DARMAWAN SISKA ANDRIANI MUHAMMAD FARUQ MIFTAKHUL AWAL FIROSATUL USRO MIFTAH NUR FAIZIN TUTIK MUTHOHAROH LIA DWI HANDAYANI ALI MUSTAFID PUTRI AJENG LISTIANA DINA KUSUMAWATI NOVITA ELIYANTI MEGA SAFITRI MOHAMMAD FARHAN SAPUTRO AHMAD SAIKUR ROHMAN MUHAMMAD RIFQI MAULANA FATKHUL ANAM JAMI'ATUL FIRDAUS
2018 2018 2018 2018 2018
3.71 2.85 3.35 3.66 3.58
2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018
2.93 2.96 3.32 3.55 3.60 3.54 3.71 3.82 3.74 3.66 3.45 3.41 3.69 3.71 3.34 3.84 3.64 3.31 2.77 3.48
2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018
3.35 3.54 3.09 3.28 3.71 3.01 3.71 3.88 3.17 3.45 2.94 2.66
2018 2018
2.34 3.46
86
2619 2620 2621 2622 2623 2624 2625 2626 2627 2628 2629 2630 2631
181110002343 181110002344 181110002346 181110002347 181110002348 181110002349 181110002350 181110002351 181110002352 181110002353 181110002354 181110002355 181110002356
….
HAPSARI MAULANA DWIYANTI AYU RISTIANI INDAH NOVITASARI IRAWATI APRILIA MUHAMMAD RAGIL TAUFIQURROHMAN AKHMAD MAULANA RIZKI ANDRIANI VIRA IZATUL AVIVA INE SAFITRI FADHILLA ZALFA ECHANANDA MOHAMMAD RIZAL YOGA ISWARA DEVI NOOR HASANAH AGUNG BUDI UTOMO
….
….
3910 181510000407
AKEEL WANGPRAYOT
LAMPIRAN B Tabel Dataset Mahasiswa Kecamatan Asal Mayong Bangsri Batealit Mlonggo Batealit Kembang Tahunan Batealit Jepara Bangsri Kalinyamatan Mayong Tahunan Pecangaan Nalumsari Tahunan Tahunan Bangsri
Asal Sekolah SMA MA MA MA SMA PKBM SMK MA SMA SMA SMK SMA PKBM SMA MA MA SMK SMK
IPK 3.30 3.61 3.73 3.58 3.61 3.02 3.41 2.77 3.28 3.21 2.95 3.67 3.10 2.78 3.11 3.53 3.22 3.21
2018 2018 2018 2018
3.81 3.59 3.70 3.33
2018 2018 2018 2018 2018 2018 2018 2018 2018
2.69 2.41 2.83 3.34 2.95 3.12 3.52 3.29 3.26
…. 2018
…. 2.90
87
Kedung Tahunan Jepara Jepara Kedung Tahunan Jepara Kedung Pakis Aji Keling Tahunan Mlonggo Kembang Pecangaan Batealit Batealit Tahunan Mlonggo Mlonggo Pecangaan Kalinyamatan Donorojo Donorojo Bangsri Batealit Donorojo Kembang Kembang Bangsri Bangsri Batealit Bangsri Bangsri Pecangaan Tahunan Pecangaan Pecangaan Pecangaan Batealit Bangsri Jepara
SMK MA SMK SMA SMK SMK SMK MA SMK MA SMK SMK SMA SMA SMK SMK SMA SMK SMK SMA SMK SMK MA SMA SMK SMK SMA SMA SMA SMA SMA MA SMK SMK SMK MA MA SMK MA SMK SMK
2.38 2.88 3.44 3.79 3.82 3.56 3.55 3.20 3.04 3.17 3.53 3.20 3.42 2.75 2.83 2.24 3.65 2.59 3.20 3.13 3.15 2.02 3.21 3.48 3.33 3.07 2.81 3.28 2.68 3.22 2.99 3.05 3.21 3.50 3.55 2.88 2.79 3.50 3.30 3.18 3.46
88
Pecangaan Keling Batealit Batealit Bangsri Mlonggo Jepara Mlonggo Pecangaan Tahunan Mlonggo Mlonggo Jepara Keling Kembang Jepara Tahunan Mlonggo Mlonggo Mlonggo Tahunan Kedung Mlonggo Batealit Batealit Pecangaan Mlonggo Jepara Tahunan Jepara Jepara Donorojo Bangsri Jepara Keling Welahan Jepara Bangsri Kedung Pakis Aji Pakis Aji
SMK SMK SMK MA SMA MA SMK MA SMK MA SMK SMK SMK SMA SMA SMK SMK SMK MA MA MA MA MA SMK SMK SMK MA MA SMA SMA SMA SMA SMA SMK SMK SMK SMA SMK SMA SMK SMA
2.90 3.08 2.89 3.04 3.41 3.13 2.98 2.83 3.02 3.84 3.31 2.99 2.48 2.47 3.09 3.48 3.15 3.40 2.89 2.71 3.46 3.37 3.18 3.60 3.16 2.89 2.86 2.98 3.40 2.98 3.22 3.15 3.21 3.16 3.05 3.27 3.01 2.64 3.56 3.00 2.01
89
Kedung Pakis Aji Luar Kecamatan Jepara Pecangaan Tahunan Pecangaan Tahunan Tahunan Kedung Tahunan Bangsri Tahunan Jepara Jepara Batealit Keling Kedung Pecangaan Bangsri Tahunan Bangsri Mlonggo Kembang Bangsri Jepara Bangsri Kembang Tahunan Tahunan Bangsri Tahunan Jepara Mlonggo Luar Kecamatan Jepara Jepara Kembang Mlonggo Batealit Mlonggo
MA SMK MA SMA SMK SMK SMA SMK SMK SMK SMK SMA SMA SMK SMA SMA SMA SMA SMA SMA SMA SMA SMK SMA SMA SMA SMK SMA SMK SMK SMA SMA SMA SMA SMA SMK SMA SMK SMK
2.52 1.69 3.16 2.87 3.27 2.91 3.06 2.59 3.04 3.39 3.54 3.25 2.74 3.86 2.38 3.09 2.92 2.90 2.93 2.50 2.18 3.26 1.48 2.66 2.66 2.80 3.56 3.16 3.05 3.17 2.65 3.08 3.20 3.43 3.21 2.81 2.05 3.21 3.20
90
Kalinyamatan Kedung Jepara Jepara Kembang Tahunan Jepara Tahunan Batealit Tahunan Bangsri ….............. Pecangaan Bangsri Donorojo Bangsri Mlonggo Jepara Batealit Jepara Bangsri Tahunan Batealit Tahunan Tahunan Tahunan Tahunan Jepara Kedung Tahunan Donorojo Jepara Jepara Kedung Mlonggo Pecangaan Donorojo Mlonggo Nalumsari Jepara Keling
SMK SMK SMK SMK SMK SMK SMK SMA SMK MA MA ….............. MA MA MA MA MA SMA MA SMK SMK SMK SMK MA SMA SMK SMK MA MA MA SMK SMK SMK MA MA SMA MA SMA SMK SMK SMK
3.16 2.98 2.83 3.31 3.54 3.22 3.34 3.06 2.95 3.19 2.27 …… 3.69 3.70 3.52 3.44 3.49 3.17 2.71 3.54 3.70 2.22 3.52 3.15 3.33 3.06 3.23 3.53 3.42 3.64 2.95 2.76 3.76 3.14 3.30 3.05 2.88 3.23 3.48 3.44 3.46
91
Tahunan Batealit Tahunan Pakis Aji Jepara Jepara Batealit Jepara Pecangaan Kedung Jepara Batealit Mlonggo Kedung Jepara Pakis Aji Mlonggo Mlonggo Bangsri Donorojo Batealit Bangsri Pakis Aji Tahunan Luar Kecamatan Jepara Tahunan Tahunan Jepara Kembang Bangsri Keling Bangsri Mlonggo Mlonggo Mlonggo Donorojo Pecangaan Nalumsari Welahan Pecangaan
MA MA MA SMK SMK SMK SMA SMK SMK SMK SMA SMK MA SMA SMA SMK SMK SMA SMA SMK MA SMK SMK SMK
3.66 3.08 2.46 3.88 2.65 3.95 2.10 3.44 2.85 3.43 2.56 3.52 3.38 3.42 3.37 3.32 3.51 3.05 3.78 3.05 3.60 3.36 3.73 3.01
SMA
2.49
SMK MA SMK SMK SMK SMK SMK SMA SMK MA MA SMK SMA SMK SMK
3.92 3.80 3.47 3.46 2.60 2.43 3.48 3.61 3.84 3.54 3.45 3.37 3.21 3.21 3.65
92
Donorojo Mlonggo Kedung Kedung Jepara Pakis Aji Tahunan Pakis Aji Pecangaan Tahunan Jepara Bangsri Jepara Bangsri Bangsri Bangsri Jepara Jepara Jepara Pecangaan Keling Nalumsari Pakis Aji Bangsri Tahunan Jepara Pakis Aji Mlonggo Bangsri Jepara Jepara Jepara Kedung Keling Tahunan Mayong Kedung Bangsri Kembang Tahunan Bangsri
MA SMA SMA SMK SMK SMK SMK SMK SMK SMK SMK SMA SMA SMA SMA SMA SMK SMK SMK SMK SMK MA SMK SMA SMA SMA SMK SMA SMK SMK SMK SMK MA SMK SMA SMA SMA SMK SMK SMK SMA
2.84 1.65 3.57 3.79 3.69 3.64 2.93 3.83 2.63 2.76 2.36 2.45 3.01 3.80 2.75 3.25 2.61 2.80 2.85 3.19 3.34 3.75 2.89 2.49 3.68 3.44 3.40 3.32 3.04 2.64 3.35 3.50 3.33 2.77 2.48 3.42 2.49 2.89 3.65 3.70 3.29
93
Pecangaan Kembang Tahunan Tahunan Jepara Tahunan Kedung Tahunan ….............. Kedung Luar Kecamatan Jepara Welahan Pakis Aji Bangsri Bangsri Mlonggo Bangsri Bangsri Jepara Jepara Bangsri Jepara Batealit Jepara Jepara Bangsri Bangsri Jepara Pecangaan Bangsri Jepara Pakis Aji Jepara Tahunan Jepara Jepara Kedung Jepara Bangsri Jepara
SMK MA SMA SMA SMK SMA SMA SMA ….............. MA
1.14 1.88 2.99 2.69 3.58 3.04 2.43 3.80 …… 3.45
SMA
3.65
SMA SMK PKBM SMK SMK SMK SMK SMK SMK MA SMK SMK SMK SMK MA SMA SMA SMA SMA MA MA SMK SMK SMA SMK SMA MA SMA SMK
3.56 3.81 3.28 3.55 3.89 2.93 3.77 3.54 2.95 2.99 3.12 3.59 3.40 3.08 1.02 3.20 3.69 3.61 3.35 2.43 3.04 3.37 3.70 3.45 3.79 3.15 3.25 3.30 3.32
94
Bangsri Batealit Batealit Pakis Aji Kalinyamatan Bangsri Pakis Aji Pakis Aji Mlonggo Tahunan Jepara Jepara Jepara Bangsri Pakis Aji Jepara Bangsri Mlonggo Jepara Batealit Jepara Batealit Tahunan Jepara Batealit Tahunan Pecangaan Bangsri Pakis Aji Jepara Batealit Pakis Aji Bangsri Tahunan Batealit Pakis Aji Tahunan Bangsri Bangsri Tahunan Jepara
SMA SMK SMK SMA SMA MA MA SMA SMK MA SMA SMA SMK SMK SMK SMK MA SMK SMK SMK SMK MA SMA SMK MA SMA SMA SMA SMA SMK SMK MA SMA SMK SMK SMK SMK SMK SMK SMA SMK
2.30 3.17 3.10 3.52 3.35 2.24 3.09 3.77 3.41 3.89 3.20 3.41 3.17 3.64 3.52 3.63 3.24 2.98 3.30 3.26 3.42 3.71 2.85 3.35 3.66 3.58 2.93 2.96 3.32 3.55 3.60 3.54 3.71 3.82 3.74 3.66 3.45 3.41 3.69 3.71 3.34
95
Kalinyamatan Jepara Mlonggo Kalinyamatan Batealit Bangsri Jepara Bangsri Bangsri Batealit Tahunan Jepara Bangsri Bangsri Batealit Batealit Batealit Batealit Kalinyamatan Pakis Aji Pakis Aji Kedung Jepara Mlonggo Mlonggo Pecangaan Jepara Bangsri Bangsri Jepara Tahunan Bangsri ….............. Tahunan
SMA SMA SMK SMK SMK MA SMA SMA SMA SMK MA SMK SMA MA MA MA SMA MA SMA SMA SMK SMA MA SMA MA SMA SMK MA SMK SMA SMA SMA ….............. SMA
3.84 3.64 3.31 2.77 3.48 3.35 3.54 3.09 3.28 3.71 3.01 3.71 3.88 3.17 3.45 2.94 2.66 2.34 3.46 3.81 3.59 3.70 3.33 2.69 2.41 2.83 3.34 2.95 3.12 3.52 3.29 3.26 …… 2.90
96
LAMPIRAN C Tabel Perhitungan Jarak Data ke Setiap Cluster (Ms. Excel) CLUSTER 1 15
2 6.094 14.000 13.000 5.001 13.039 7.309 1.438 13.032 11.052 14.043 10.076 6.083 2.308 2.408 4.040 1.010 1.485 14.043 9.147 1.276 11.048 11.046 9.057 1.419 11.046 9.013 3.225 8.016 1.422 5.121 7.076 2.417 13.065 13.117 1.414 5.214
CLUSTER 2 3.674
16
2 7.071 15.005 14.009 6.011 14.041 8.249 2.244 14.008 12.042 15.033 11.049 7.085 2.831 3.194 5.001 2.023 2.236 15.033 10.086 2.030 12.044 12.055 10.067 2.260 12.046 10.000 4.127 9.000 2.256 6.083 8.065 3.197 14.041 14.070 2.276 6.116
CLUSTER 3 3.227
4
3 5.385 3.181 2.284 6.091 2.850 4.130 10.001 2.291 2.000 3.606 1.048 5.401 10.051 9.232 7.073 10.054 10.000 3.000 2.186 10.057 0.181 2.069 2.076 10.004 0.288 2.237 8.003 3.164 10.004 6.000 4.475 9.233 2.045 2.247 10.206 6.038
3.262
97
5.121 2.300 10.063 12.154 12.009 14.037 13.043 12.057 7.123 7.082 14.071 14.043 13.056 14.014 14.043 2.242 1.420 2.154 2.185 2.242 13.005 14.044 11.047 2.367 8.084 13.062 13.015 14.038 5.030 11.067 5.071 2.330 1.013 5.112 5.145 11.109 8.152 7.095 11.047 1.509 5.106
6.083 3.164 11.046 13.094 13.000 15.035 14.036 13.039 8.073 8.062 15.043 15.033 14.038 15.001 15.033 3.174 2.259 3.021 3.031 3.174 14.000 15.033 12.044 3.179 9.057 14.040 14.001 15.034 6.001 12.044 6.013 3.169 2.091 6.083 6.087 12.064 9.087 8.063 12.044 2.238 6.085
6.000 9.220 1.006 1.593 1.415 3.612 2.001 1.018 4.495 4.472 3.653 3.606 2.842 3.169 3.000 9.003 10.004 9.064 9.067 9.003 2.236 3.001 0.197 9.007 3.006 2.034 2.247 3.609 6.084 0.279 6.098 9.003 10.066 6.000 6.006 0.778 3.692 4.476 0.220 10.001 6.002
98
5.061 5.091 1.023 9.005 5.024 13.039 13.049 2.371 5.065 11.022 1.441 11.067 11.055 12.053 14.043 11.057 8.087 1.079 11.065 14.074 9.056 3.234 3.572 9.074 3.732 1.126 2.375 1.470 2.364 1.540 1.781 9.078 1.443 14.036 1.476 11.085 11.047 13.103 8.084 9.087 2.367
6.009 6.022 2.013 10.001 6.000 14.041 14.036 3.181 6.011 12.002 2.243 12.044 12.042 13.039 15.033 12.042 9.057 1.415 12.044 15.045 10.055 4.130 4.299 10.025 4.400 0.070 3.182 2.237 3.178 2.242 2.325 10.052 2.242 15.037 2.236 12.051 12.058 14.061 9.056 10.054 3.179
6.094 6.107 10.052 2.238 6.083 2.029 2.003 9.008 6.096 1.038 10.199 2.020 2.000 2.239 3.606 0.099 3.008 11.000 2.016 3.063 2.844 8.004 8.340 2.357 8.153 12.042 9.228 10.000 9.007 10.200 10.022 2.012 10.001 3.013 10.198 2.066 0.597 2.964 3.610 2.849 9.227
99
14.055 1.838 14.114 5.116 7.404 14.072 11.092 14.063 7.072 1.505 1.544 14.045 1.744 11.061 5.121 1.434 11.055 7.124 5.353 13.047 5.121 10.063 9.082 11.078 11.051 7.072 1.487 11.051 1.542 13.058 1.112 14.071 ….............. 2.000 14.000 12.001 14.002 5.004 11.057 13.036 11.046
15.036 2.351 15.069 6.083 8.250 15.044 12.055 15.039 8.069 2.237 2.243 15.033 2.309 12.042 6.083 1.021 12.042 8.073 6.196 14.036 6.083 11.046 10.053 12.048 12.042 8.068 2.236 12.042 2.242 14.038 2.000 15.031 ….............. 3.036 15.008 13.003 15.002 6.006 12.042 14.010 12.046
3.621 10.226 3.763 6.325 4.380 3.655 2.088 3.636 4.011 10.199 10.002 3.001 10.216 2.008 6.325 12.167 2.001 4.026 6.440 2.001 6.000 1.005 2.019 0.433 0.049 4.010 10.000 0.074 10.200 2.024 10.050 3.315 ….............. 9.066 3.193 1.437 3.167 6.087 2.002 2.303 0.280
100
14.036 2.028 13.039 1.130 1.455 1.540 1.482 11.001 9.004 1.000 12.064 11.083 11.046 9.016 5.014 2.321 12.026 5.118 4.128 11.048 8.065 1.000 13.014 1.574 3.169 11.093 11.049 13.133 11.048 2.383 9.059 11.102 13.039 5.009 9.059 11.050 3.183 5.102 5.137 14.036 12.058
15.041 2.453 14.039 2.002 2.239 2.242 2.236 12.004 10.002 2.043 13.041 12.051 12.053 10.000 6.000 3.167 13.005 6.083 5.105 12.044 9.058 2.046 14.001 2.143 4.175 12.055 12.063 14.081 12.043 3.185 10.052 12.060 14.039 6.002 10.052 12.042 4.124 6.089 6.085 15.043 13.040
3.032 10.054 2.017 10.051 10.198 10.002 10.000 1.035 2.241 10.057 1.049 0.507 0.500 2.239 6.083 9.222 1.465 6.325 7.003 0.182 3.006 10.058 2.244 10.082 8.024 0.613 0.684 3.058 0.179 9.009 2.007 2.121 2.017 6.084 2.833 2.003 8.000 6.005 6.328 3.643 1.022
101
13.000 14.039 3.163 1.561 1.841 1.435 1.008 11.047 7.074 14.077 8.158 14.037 5.099 5.102 5.002 12.002 2.256 4.149 1.101 2.236 12.029 5.485 9.056 9.056 11.045 3.162 1.596 3.166 2.470 1.683 11.123 14.089 11.065 14.036 14.066 14.042 11.096 11.080 11.076 2.288 8.069
14.005 15.034 4.154 2.246 1.240 2.340 2.081 12.044 8.066 15.046 9.091 15.035 6.095 6.114 6.008 13.002 3.166 5.099 1.414 3.191 13.006 6.283 10.056 10.066 12.051 4.144 2.255 4.167 3.219 2.284 12.073 15.053 12.044 15.044 15.041 15.033 12.057 12.049 12.048 3.162 9.056
2.261 3.002 8.014 10.003 12.190 10.021 10.064 0.209 4.005 3.072 3.114 3.008 6.334 6.028 6.089 1.426 9.001 7.280 11.000 9.009 1.476 6.526 2.845 2.069 0.428 8.009 10.005 8.020 9.023 10.013 0.899 3.696 2.016 3.645 3.642 3.606 0.649 0.459 0.417 9.000 3.001
102
4.001 3.257 14.085 1.414 11.048 3.174 5.111 14.050 11.093 11.050 11.047 9.006 8.112 1.852 6.088 9.133 14.057 7.071 1.414 14.041 3.377 7.227 1.569 1.722 11.046 1.551 9.140 1.420 ….............. 9.003 1.414 1.007 3.165 14.148 14.036 5.104 14.055 14.036 11.046 11.069 14.017
5.027 4.137 15.051 2.281 12.043 4.127 6.083 15.035 12.056 12.042 12.045 10.001 9.067 2.358 7.074 10.077 15.037 8.074 2.285 15.033 3.787 8.113 2.248 2.300 12.047 2.244 10.081 2.308 ….............. 10.003 1.085 1.452 4.164 15.133 15.037 6.119 15.036 15.043 12.046 12.045 15.002
7.088 8.009 3.686 10.206 2.008 8.001 6.325 3.009 0.619 0.089 0.238 2.237 3.039 10.228 5.387 2.932 3.023 4.019 10.009 3.606 9.246 4.350 10.202 10.214 0.315 10.201 2.947 10.212 ….............. 2.244 12.172 11.184 8.019 3.162 3.014 6.033 3.018 3.043 0.280 0.316 3.174
103
11.059 13.039 11.049 11.061 14.249 14.044 11.045 2.237 14.040 11.071 3.066 11.050 1.414 11.048 11.046 9.071 11.008 14.041 11.051 14.103 13.048 13.051 3.166 10.055 14.073 3.056 3.164 5.106 1.022 11.055 11.048 11.057 14.036 3.166 11.045 14.007 5.146 11.052 13.045 11.048 13.000
12.042 14.040 12.043 12.042 15.161 15.033 12.051 3.185 15.034 12.027 4.004 12.042 2.285 12.044 12.055 10.050 12.000 15.033 12.042 15.062 14.036 14.036 4.134 11.046 15.032 4.002 4.158 6.085 2.106 12.042 12.043 12.042 15.039 4.134 12.048 15.000 6.088 12.042 14.036 12.043 14.008
0.139 2.027 0.143 0.181 3.874 3.606 2.046 9.226 3.607 1.303 8.065 0.108 10.009 2.008 0.524 2.831 1.000 3.606 0.059 3.732 2.002 2.006 8.250 2.238 3.323 8.064 8.262 6.002 10.069 2.001 2.006 0.089 3.024 8.004 0.369 3.162 6.007 0.042 2.000 0.155 2.281
104
1.637 11.050 13.000 1.417 2.355 14.054 3.182 11.046 13.039 3.003 14.036 1.421 13.039 3.162 1.432 14.038 14.036 1.415 11.050 10.051 11.045 5.112 10.090 13.040 14.004 11.046 14.048 1.467 13.038 1.198 11.045 14.037 14.009 13.002 13.021 13.078 13.068 10.052 3.165 3.163 9.055
2.268 12.042 14.007 2.264 3.176 15.036 4.124 12.046 14.041 4.012 15.041 2.312 14.045 4.146 2.247 15.034 15.040 2.287 12.042 11.062 12.049 6.083 11.055 14.038 15.001 12.046 15.034 1.002 14.044 2.011 12.051 15.047 15.000 14.002 14.003 14.047 14.028 11.048 4.164 4.139 10.061
10.206 0.086 2.272 10.203 9.225 3.618 8.246 0.286 2.029 8.067 3.633 10.015 2.056 8.010 10.002 3.004 3.030 10.208 0.077 2.310 2.035 6.000 1.114 2.012 3.164 2.019 3.610 12.166 2.050 10.053 0.445 3.657 3.164 2.244 2.259 2.892 2.419 2.245 8.264 8.007 2.862
105
11.005 5.193 5.156 2.390 11.050 14.019 14.046 11.046 1.466 14.042 ….............. 1.613
12.000 6.106 6.055 3.187 12.042 15.003 15.034 12.045 2.237 15.033 ….............. 2.260
1.002 6.350 6.141 9.230 0.079 3.178 3.003 2.016 10.198 3.606 ….............. 10.205
LAMPIRAN D Tabel Clustering Data Mahasiswa (Ms. Excel) CLUSTER 1
CLUSTER 2
CLUSTER 3 OK OK OK
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
106
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
107
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
108
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
109
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
110
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
111
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
112
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
113
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
114
OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK OK
1407
118
2385