Resume Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia Institut menggunakan Aplikasi Data Mining

Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia

Institut menggunakan Aplikasi Data Mining

Masalah putus sekolah mahasiswa menjadi perhatian utama di kalangan akademisi dan manajemen universitas. Tingginya angka putus sekolah mahasiswa berdampak pada reputasi universitas seperti mengurangi pendaftaran mahasiswa, mempengaruhi pendapatan universitas, kerugian keuangan bagi negara, dan meningkatkan adanya masalah sosial di kalangan mahasiswa. Dalam penelitian ini, 2 pengklasifikasi populer digunakan untuk memprediksi putus sekolah siswa yaitu pohon keputusan dan model regresi logistik masing-masing.

Mengelola masalah putus sekolah mahasiswa menjadi perhatian utama manajemen universitas. Putus sekolah mungkin disebabkan oleh banyak faktor seperti kinerja akademik, kesehatan, alasan keluarga dan pribadi dan bervariasi tergantung pada sifat studi dan penyedia pendidikan tinggi.

Penulis yang sesuai.

Alamat email: hanaroslan1996@gmail.com https://doi.org/10.37934/araset.45.2.168176 untuk analisis putus sekolah siswa untuk mengenali siswa dengan kemungkinan putus sekolah yang tinggi. Analisis ini dapat menawarkan cara bagi manajemen pendidikan tinggi untuk mengambil langkah-langkah pencegahan dengan memahami siswa yang berisiko putus sekolah. Sehingga mengurangi kemungkinan siswa ini putus sekolah dan berhenti belajar.

Penambangan data merupakan alat yang penting dan bermanfaat dalam proses pengambilan keputusan. Pengetahuan baru dapat diekstraksi melalui analisis pola data tersembunyi menggunakan berbagai teknik data mining.

Nama Variabel	Model Peran	Pengukuran Tingkat	Deskripsi
Jenis Kelamin	Masukan	Binar	Jenis kelamin siswa yang mengacu pada laki-laki atau perempuan.
Nilai Siswa	Masukan	Nominal	Prestasi belajar siswa berdasarkan nilai Gagal, Sedang atau Bagus sekali.
Tempat Lahir	Masukan	Nominal	Negara lahir masing-masing siswa.
Kursus	Masukan	Nominal	Mata kuliah yang diambil oleh mahasiswa di universitas.
Tingkat Pendidikan	Masukan	Nominal	Pendidikan tinggi terakhir para siswa.
Sponsor/Penyedia Dana	Masukan	Nominal	Pinjaman pendidikan atau pinjaman pendidikan untuk menutupi biaya sekolah dari para siswa.
Pendapatan Orang Tua	Masukan	Interval	Penghasilan orang tua siswa (dalam RM).
Lokasi	Masukan	Ordinal	Tempat tinggal siswa yang mengacu pada pedesaan, sub-pedesaan
Jumlah Tanggungan	Masukan	Interval	Ketergantungan pada keluarga siswa untuk dukungan keuangan.
Usia	Masukan	Nominal	Usia mahasiswa saat pertama kali mendaftar ke universitas (dalam tahun).
CGPA	Masukan	Interval	Nilai rata-rata kumulatif, CGPA diukur berdasarkankinerja siswa dalam mata kuliah yang mereka ikuti. CGPA Berkisar dari:0,00 hingga 4,00.
Kurikulum Aktivitas	Masukan	Nominal	Nilai yang dicapai siswa dalam kegiatan kurikulumnyayang dimulai dari kelas A, B, C, D dan G.
Status	Target	Binary	Status Siswa (Dropout, Bukan Dropout)

Deskripsi metode

Dalam penelitian ini, 2 metode klasifikasi – pohon keputusan dan regresi logistik – digunakan untuk membangun model prediksi. Masing-masing model dibandingkan satu sama lain menggunakan 3 pengaturan partisi data pelatihan dan pengujian yang berbeda – masing-masing 80/30, 70/30 dan 60/40. Sebagai hasilnya, dalam karya penelitian ini 36 pengaturan model klasifikasi berbeda dibuat seperti yang digambarkan pada tabel 3. Perangkat lunak yang digunakan untuk melakukan prediksi analisis putus sekolah siswa adalah sas enterprise miner. Gambar 1 menunjukkan gambaran umum desain penelitian untuk memprediksi putus sekolah siswa menggunakan teknik data mining. Proses penelitian dilakukan berdasarkan kegiatan yang dirancang pada setiap fase untuk mencapai tujuan masing-masing yang disebutkan dalam penelitian ini.

List of variables with each description of the data set

Untuk mengidentifikasi statistik deskriptif yang paling signifikan yang mencakup analisis eksploratif.

Untuk membandingkan dan menemukan model terbaik membandingkan dan mengevaluasi semua model yang dibuat dan memilih model terbaik berdasarkan prediksi putus sekolah siswa.

Data.

Pendekatan data sekunder digunakan dalam penelitian ini dengan memperoleh data 7606 mahasiswa dari salah satu universitas swasta di malaysia. Jumlah siswa putus sekolah sebanyak 931 orang, dan 6675 siswa menyelesaikan studi mereka. Oleh karena itu, jumlah mahasiswa yang menyelesaikan studinya di universitas lebih tinggi dibandingkan dengan jumlah mahasiswa yang putus sekolah.

Jumlah tanggungan

Jenis kelamin siswa yang mengacu pada laki-laki atau perempuan.

Prestasi siswa berdasarkan nilai gagal, rata-rata atau

Sangat baik.

Keadaan kelahiran setiap siswa.

Kursus yang diambil oleh mahasiswa di universitas.

Pendidikan tinggi terakhir para siswa.

Pendidikan sponsor atau pinjaman pendidikan untuk menutupi biaya kuliah siswa.

Hingga pukul 4.00.

D, di = at1, at2,..., di AT

N dengan seperangkat label kelas di d.

Berdasarkan informasi deskriptif data, rata-rata pendapatan orang tua adalah rm 2192,31 yang berkisar dari nilai terendah rm 0,00 sampai dengan nilai tertinggi rm 34.355,00. Sebagian besar siswa memperoleh nilai a dalam kegiatan kurikulum mereka. Selain itu, skor rata-rata untuk cgpa adalah 2,47 yang merupakan kelas sedang dalam kelas siswa. Rata-rata, jumlah anggota keluarga dalam keluarga siswa adalah 5 orang. Perusahaan dana pendidikan tinggi nasional telah mendanai sebagian besar mahasiswa.

Klasifikasi metode

Karya penelitian ini bertujuan untuk membandingkan kinerja 2 teknik klasifikasi dalam konteks putus sekolah siswa.

Pohon keputusan

Pohon keputusan yang dibangun untuk memprediksi fungsi target bernilai diskrit, di mana pohon keputusan mewakili fungsi yang dipelajari yang menghubungkan variabel prediktor ke variabel yang diharapkan.

Regresi logistik

Regresi logistik sebagaimana didefinisikan oleh adalah teknik regresi nonlinier yang mengaitkan skor probabilitas bersyarat dengan setiap instans data.

Langkah-langkah evaluasi

Untuk mengevaluasi kinerja model, metrik pengukuran populer yang dikenal sebagai ukuran akurasi digunakan

Gambar. 2.

Ringkasan Bidang Data untuk Data Siswa

Nama Variabel	Pengukuran Tingkat	Jumlah Nilai	Berarti	Standar Deviasi
Jenis Kelamin	Binary	2	-	-
Nilai siswa	Nominal	3	-	-
Tempat Lahir	Nominal	24	-	-
Kursus	Nominal	15	-	-
Tingkat Pendidikan	Nominal	22	-	-
Sponsor/Penyedia Dana	Nominal	16	-	-
Pendapatan Orang Tua	Interval	-	2192.31	1823.79
Lokasi	Ordinal	4	-	-
Jumlah Tanggungan	Interval	-	4.66	1.87
Usia	Nominal	-	18.38	0.84
CGPA	Interval	-	2.47	1.06
Kurikulum Aktivitas	Nominal	5	-	-
Status	Binary	2	-	-

Hasil dari semua 36 model pada ukuran akurasi untuk pelatihan dan pengujian tercantum di

Tabel 4. Setiap baris diisi dengan pengaturan eksperimental spesifik mereka. Model yang menggunakan pohon keputusan dengan chi-square sebagai kriteria target nominal-partisi data 80/20 memberikan akurasi tertinggi.

Didukung oleh tcpdf (www.tcpdf.org)

(Abbas El Husein 24)

Cari Blog Ini

Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia Institut menggunakan Aplikasi

Resume Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia Institut menggunakan Aplikasi Data Mining

Komentar

Posting Komentar