Resume Prediksi Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia Institut menggunakan Aplikasi Data Mining
Prediksi
Jumlah Mahasiswa Dropout di Perguruan Tinggi Swasta Malaysia
Institut
menggunakan Aplikasi Data Mining
Masalah putus sekolah
mahasiswa menjadi perhatian utama di kalangan akademisi dan manajemen
universitas. Tingginya angka putus sekolah mahasiswa berdampak pada reputasi
universitas seperti mengurangi pendaftaran mahasiswa, mempengaruhi pendapatan
universitas, kerugian keuangan bagi negara, dan meningkatkan adanya masalah
sosial di kalangan mahasiswa. Dalam penelitian ini, 2 pengklasifikasi populer
digunakan untuk memprediksi putus sekolah siswa yaitu pohon keputusan dan model
regresi logistik masing-masing.
Mengelola masalah putus
sekolah mahasiswa menjadi perhatian utama manajemen universitas. Putus sekolah
mungkin disebabkan oleh banyak faktor seperti kinerja akademik, kesehatan,
alasan keluarga dan pribadi dan bervariasi tergantung pada sifat studi dan penyedia
pendidikan tinggi.
Penulis yang sesuai.
Alamat email:
hanaroslan1996@gmail.com https://doi.org/10.37934/araset.45.2.168176 untuk
analisis putus sekolah siswa untuk mengenali siswa dengan kemungkinan putus
sekolah yang tinggi. Analisis ini dapat menawarkan cara bagi manajemen
pendidikan tinggi untuk mengambil langkah-langkah pencegahan dengan memahami
siswa yang berisiko putus sekolah. Sehingga mengurangi kemungkinan siswa ini
putus sekolah dan berhenti belajar.
Penambangan data
merupakan alat yang penting dan bermanfaat dalam proses pengambilan keputusan.
Pengetahuan baru dapat diekstraksi melalui analisis pola data tersembunyi
menggunakan berbagai teknik data mining.
|
Nama
Variabel |
Model |
Pengukuran
Tingkat |
Deskripsi |
|
Jenis
Kelamin |
Masukan |
Binar |
Jenis
kelamin siswa yang mengacu pada laki-laki atau perempuan. |
|
Nilai
Siswa |
Masukan |
Nominal
|
Prestasi
belajar siswa berdasarkan nilai Gagal, Sedang atau Bagus
sekali. |
|
Tempat
Lahir |
Masukan |
Nominal
|
Negara
lahir masing-masing siswa. |
|
Kursus |
Masukan |
Nominal
|
Mata
kuliah yang diambil oleh mahasiswa di universitas. |
|
Tingkat
Pendidikan |
Masukan |
Nominal
|
Pendidikan
tinggi terakhir para siswa. |
|
Sponsor/Penyedia
Dana |
Masukan |
Nominal
|
Pinjaman
pendidikan atau pinjaman pendidikan untuk menutupi biaya sekolah dari para
siswa. |
|
Pendapatan
Orang Tua |
Masukan |
Interval
|
Penghasilan
orang tua siswa (dalam RM). |
|
Lokasi |
Masukan |
Ordinal
|
Tempat
tinggal siswa yang mengacu pada pedesaan, sub-pedesaan |
|
Jumlah Tanggungan |
Masukan |
Interval
|
Ketergantungan
pada keluarga siswa untuk dukungan keuangan. |
|
Usia |
Masukan |
Nominal
|
Usia
mahasiswa saat pertama kali mendaftar ke universitas (dalam tahun). |
|
CGPA
|
Masukan |
Interval
|
Nilai
rata-rata kumulatif, CGPA diukur berdasarkankinerja siswa dalam mata kuliah
yang mereka ikuti. CGPA Berkisar dari:0,00 hingga 4,00. |
|
Kurikulum Aktivitas |
Masukan |
Nominal
|
Nilai
yang dicapai siswa dalam kegiatan kurikulumnyayang dimulai dari kelas A, B,
C, D dan G. |
|
Status
|
Target
|
Binary
|
Status
Siswa (Dropout, Bukan Dropout) |
Deskripsi metode
Dalam penelitian ini, 2
metode klasifikasi – pohon keputusan dan regresi logistik – digunakan untuk
membangun model prediksi. Masing-masing model dibandingkan satu sama lain
menggunakan 3 pengaturan partisi data pelatihan dan pengujian yang berbeda –
masing-masing 80/30, 70/30 dan 60/40. Sebagai hasilnya, dalam karya penelitian
ini 36 pengaturan model klasifikasi berbeda dibuat seperti yang digambarkan
pada tabel 3. Perangkat lunak yang digunakan untuk melakukan prediksi analisis
putus sekolah siswa adalah sas enterprise miner. Gambar 1 menunjukkan gambaran
umum desain penelitian untuk memprediksi putus sekolah siswa menggunakan teknik
data mining. Proses penelitian dilakukan berdasarkan kegiatan yang dirancang
pada setiap fase untuk mencapai tujuan masing-masing yang disebutkan dalam
penelitian ini.
List of variables with
each description of the data set
Untuk mengidentifikasi
statistik deskriptif yang paling signifikan yang mencakup analisis eksploratif.
Untuk membandingkan dan
menemukan model terbaik membandingkan dan mengevaluasi semua model yang dibuat
dan memilih model terbaik berdasarkan prediksi putus sekolah siswa.
Data.
Pendekatan data sekunder
digunakan dalam penelitian ini dengan memperoleh data 7606 mahasiswa dari salah
satu universitas swasta di malaysia. Jumlah siswa putus sekolah sebanyak 931
orang, dan 6675 siswa menyelesaikan studi mereka. Oleh karena itu, jumlah
mahasiswa yang menyelesaikan studinya di universitas lebih tinggi dibandingkan
dengan jumlah mahasiswa yang putus sekolah.
Jumlah tanggungan
Jenis kelamin siswa yang
mengacu pada laki-laki atau perempuan.
Prestasi siswa
berdasarkan nilai gagal, rata-rata atau
Sangat baik.
Keadaan kelahiran setiap
siswa.
Kursus yang diambil oleh
mahasiswa di universitas.
Pendidikan tinggi
terakhir para siswa.
Pendidikan sponsor atau
pinjaman pendidikan untuk menutupi biaya kuliah siswa.
Hingga pukul 4.00.
D, di = at1, at2,..., di
AT
N dengan seperangkat
label kelas di d.
Berdasarkan informasi
deskriptif data, rata-rata pendapatan orang tua adalah rm 2192,31 yang berkisar
dari nilai terendah rm 0,00 sampai dengan nilai tertinggi rm 34.355,00.
Sebagian besar siswa memperoleh nilai a dalam kegiatan kurikulum mereka. Selain
itu, skor rata-rata untuk cgpa adalah 2,47 yang merupakan kelas sedang dalam
kelas siswa. Rata-rata, jumlah anggota keluarga dalam keluarga siswa adalah 5
orang. Perusahaan dana pendidikan tinggi nasional telah mendanai sebagian besar
mahasiswa.
Klasifikasi metode
Karya penelitian ini
bertujuan untuk membandingkan kinerja 2 teknik klasifikasi dalam konteks putus
sekolah siswa.
Pohon keputusan
Pohon keputusan yang
dibangun untuk memprediksi fungsi target bernilai diskrit, di mana pohon
keputusan mewakili fungsi yang dipelajari yang menghubungkan variabel prediktor
ke variabel yang diharapkan.
Regresi logistik
Regresi logistik
sebagaimana didefinisikan oleh adalah teknik regresi nonlinier yang mengaitkan
skor probabilitas bersyarat dengan setiap instans data.
Langkah-langkah evaluasi
Untuk mengevaluasi kinerja model, metrik pengukuran populer yang dikenal sebagai ukuran akurasi digunakan
Gambar. 2.
Ringkasan Bidang Data untuk Data Siswa
|
Nama Variabel |
Pengukuran Tingkat |
Jumlah Nilai |
Berarti |
Standar Deviasi |
|
Jenis Kelamin |
Binary |
2 |
- |
- |
|
Nilai siswa |
Nominal |
3 |
- |
- |
|
Tempat Lahir |
Nominal |
24 |
- |
- |
|
Kursus |
Nominal |
15 |
- |
- |
|
Tingkat Pendidikan |
Nominal |
22 |
- |
- |
|
Sponsor/Penyedia Dana |
Nominal |
16 |
- |
- |
|
Pendapatan Orang Tua |
Interval |
- |
2192.31 |
1823.79 |
|
Lokasi |
Ordinal |
4 |
- |
- |
|
Jumlah Tanggungan |
Interval |
- |
4.66 |
1.87 |
|
Usia |
Nominal |
- |
18.38 |
0.84 |
|
CGPA |
Interval |
- |
2.47 |
1.06 |
|
Kurikulum Aktivitas |
Nominal |
5 |
- |
- |
|
Status |
Binary |
2 |
- |
- |
Hasil dari semua 36 model
pada ukuran akurasi untuk pelatihan dan pengujian tercantum di
Tabel 4. Setiap baris
diisi dengan pengaturan eksperimental spesifik mereka. Model yang menggunakan
pohon keputusan dengan chi-square sebagai kriteria target nominal-partisi data
80/20 memberikan akurasi tertinggi.
Didukung oleh tcpdf
(www.tcpdf.org)
Komentar
Posting Komentar