Resume Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia Institut menggunakan Aplikasi Data Mining

Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia

Institut menggunakan Aplikasi Data Mining

Masalah putus sekolah mahasiswa menjadi perhatian utama di kalangan akademisi dan manajemen universitas. Tingginya angka putus sekolah mahasiswa berdampak pada reputasi universitas seperti mengurangi pendaftaran mahasiswa, mempengaruhi pendapatan universitas, kerugian keuangan bagi negara, dan meningkatkan adanya masalah sosial di kalangan mahasiswa. Dalam penelitian ini, 2 pengklasifikasi populer digunakan untuk memprediksi putus sekolah siswa yaitu pohon keputusan dan model regresi logistik masing-masing.

Mengelola masalah putus sekolah mahasiswa menjadi perhatian utama manajemen universitas. Putus sekolah mungkin disebabkan oleh banyak faktor seperti kinerja akademik, kesehatan, alasan keluarga dan pribadi dan bervariasi tergantung pada sifat studi dan penyedia pendidikan tinggi.

Penulis yang sesuai.

Alamat email: hanaroslan1996@gmail.com https://doi.org/10.37934/araset.45.2.168176 untuk analisis putus sekolah siswa untuk mengenali siswa dengan kemungkinan putus sekolah yang tinggi. Analisis ini dapat menawarkan cara bagi manajemen pendidikan tinggi untuk mengambil langkah-langkah pencegahan dengan memahami siswa yang berisiko putus sekolah. Sehingga mengurangi kemungkinan siswa ini putus sekolah dan berhenti belajar.

Penambangan data merupakan alat yang penting dan bermanfaat dalam proses pengambilan keputusan. Pengetahuan baru dapat diekstraksi melalui analisis pola data tersembunyi menggunakan berbagai teknik data mining.

Nama Variabel

Model
Peran

Pengukuran Tingkat

Deskripsi

Jenis Kelamin

Masukan

Binar

Jenis kelamin siswa yang mengacu pada laki-laki atau perempuan.

Nilai Siswa

Masukan

Nominal

Prestasi belajar siswa berdasarkan nilai Gagal, Sedang atau

Bagus sekali.

Tempat Lahir

Masukan

Nominal

Negara lahir masing-masing siswa.

Kursus

Masukan

Nominal

Mata kuliah yang diambil oleh mahasiswa di universitas.

Tingkat Pendidikan

Masukan

Nominal

Pendidikan tinggi terakhir para siswa.

Sponsor/Penyedia Dana

Masukan

Nominal

Pinjaman pendidikan atau pinjaman pendidikan untuk menutupi biaya sekolah dari para siswa.

Pendapatan Orang Tua

Masukan

Interval

Penghasilan orang tua siswa (dalam RM).

Lokasi

Masukan

Ordinal

Tempat tinggal siswa yang mengacu pada pedesaan, sub-pedesaan

Jumlah

Tanggungan

Masukan

Interval

Ketergantungan pada keluarga siswa untuk dukungan keuangan.

Usia

Masukan

Nominal

Usia mahasiswa saat pertama kali mendaftar ke universitas (dalam tahun).

CGPA

Masukan

Interval

Nilai rata-rata kumulatif, CGPA diukur berdasarkankinerja siswa dalam mata kuliah yang mereka ikuti. CGPA Berkisar dari:0,00 hingga 4,00.

Kurikulum

Aktivitas

Masukan

Nominal

Nilai yang dicapai siswa dalam kegiatan kurikulumnyayang dimulai dari kelas A, B, C, D dan G.

Status

Target

Binary

Status Siswa (Dropout, Bukan Dropout)

 





























Deskripsi metode

Dalam penelitian ini, 2 metode klasifikasi – pohon keputusan dan regresi logistik – digunakan untuk membangun model prediksi. Masing-masing model dibandingkan satu sama lain menggunakan 3 pengaturan partisi data pelatihan dan pengujian yang berbeda – masing-masing 80/30, 70/30 dan 60/40. Sebagai hasilnya, dalam karya penelitian ini 36 pengaturan model klasifikasi berbeda dibuat seperti yang digambarkan pada tabel 3. Perangkat lunak yang digunakan untuk melakukan prediksi analisis putus sekolah siswa adalah sas enterprise miner. Gambar 1 menunjukkan gambaran umum desain penelitian untuk memprediksi putus sekolah siswa menggunakan teknik data mining. Proses penelitian dilakukan berdasarkan kegiatan yang dirancang pada setiap fase untuk mencapai tujuan masing-masing yang disebutkan dalam penelitian ini.

List of variables with each description of the data set

 

Untuk mengidentifikasi statistik deskriptif yang paling signifikan yang mencakup analisis eksploratif.

Untuk membandingkan dan menemukan model terbaik membandingkan dan mengevaluasi semua model yang dibuat dan memilih model terbaik berdasarkan prediksi putus sekolah siswa.

Data.

Pendekatan data sekunder digunakan dalam penelitian ini dengan memperoleh data 7606 mahasiswa dari salah satu universitas swasta di malaysia. Jumlah siswa putus sekolah sebanyak 931 orang, dan 6675 siswa menyelesaikan studi mereka. Oleh karena itu, jumlah mahasiswa yang menyelesaikan studinya di universitas lebih tinggi dibandingkan dengan jumlah mahasiswa yang putus sekolah.

Jumlah tanggungan

Jenis kelamin siswa yang mengacu pada laki-laki atau perempuan.

Prestasi siswa berdasarkan nilai gagal, rata-rata atau

Sangat baik.

Keadaan kelahiran setiap siswa.

Kursus yang diambil oleh mahasiswa di universitas.

Pendidikan tinggi terakhir para siswa.

Pendidikan sponsor atau pinjaman pendidikan untuk menutupi biaya kuliah siswa.

Hingga pukul 4.00.

D, di = at1, at2,..., di AT

N dengan seperangkat label kelas di d.

Berdasarkan informasi deskriptif data, rata-rata pendapatan orang tua adalah rm 2192,31 yang berkisar dari nilai terendah rm 0,00 sampai dengan nilai tertinggi rm 34.355,00. Sebagian besar siswa memperoleh nilai a dalam kegiatan kurikulum mereka. Selain itu, skor rata-rata untuk cgpa adalah 2,47 yang merupakan kelas sedang dalam kelas siswa. Rata-rata, jumlah anggota keluarga dalam keluarga siswa adalah 5 orang. Perusahaan dana pendidikan tinggi nasional telah mendanai sebagian besar mahasiswa.

Klasifikasi metode

Karya penelitian ini bertujuan untuk membandingkan kinerja 2 teknik klasifikasi dalam konteks putus sekolah siswa.

Pohon keputusan

Pohon keputusan yang dibangun untuk memprediksi fungsi target bernilai diskrit, di mana pohon keputusan mewakili fungsi yang dipelajari yang menghubungkan variabel prediktor ke variabel yang diharapkan.

Regresi logistik

Regresi logistik sebagaimana didefinisikan oleh adalah teknik regresi nonlinier yang mengaitkan skor probabilitas bersyarat dengan setiap instans data.

Langkah-langkah evaluasi

Untuk mengevaluasi kinerja model, metrik pengukuran populer yang dikenal sebagai ukuran akurasi digunakan 

Gambar. 2.

Ringkasan Bidang Data untuk Data Siswa

Nama Variabel

Pengukuran

Tingkat

Jumlah Nilai

Berarti

Standar

Deviasi

Jenis Kelamin

Binary

2

-

-

Nilai siswa

Nominal

3

-

-

Tempat Lahir

Nominal

24

-

-

Kursus

Nominal

15

-

-

Tingkat Pendidikan

Nominal

22

-

-

Sponsor/Penyedia Dana

Nominal

16

-

-

Pendapatan Orang Tua

Interval

-

2192.31

1823.79

Lokasi

Ordinal

4

-

-

Jumlah Tanggungan

Interval

-

4.66

1.87

Usia

Nominal

-

18.38

0.84

CGPA

Interval

-

2.47

1.06

Kurikulum

Aktivitas

Nominal

5

-

-

Status

Binary

2

-

-

 

Hasil dari semua 36 model pada ukuran akurasi untuk pelatihan dan pengujian tercantum di

Tabel 4. Setiap baris diisi dengan pengaturan eksperimental spesifik mereka. Model yang menggunakan pohon keputusan dengan chi-square sebagai kriteria target nominal-partisi data 80/20 memberikan akurasi tertinggi.

Didukung oleh tcpdf (www.tcpdf.org)

(Abbas El Husein 24)

Komentar