- Source: Penambangan data pendidikan
Penambangan data pendidikan (Inggris: educational data mining, EDM) adalah bidang penelitian mengenai kajian penerapan konsep dan metode penambangan data, pembelajaran mesin, dan statistik pada data dan informasi yang berasal dari lingkungan pendidikan (misalnya, data dan informasi dari lingkungan universitas dan sistem bimbingan belajar cerdas). Kajian dalam bidang ini bertujuan untuk mengembangkan konsep dan metode untuk eksplorasi informasi dari dunia pendidikan, yang memiliki beberapa tingkat hierarki, untuk menemukan wawasan baru tentang bagaimana orang belajar dalam konteks situasi tertentu. Kajian terhadap penambangan data pendidikan telah berkontribusi dengn memperluas kajian teori pembelajaran yang diselidiki oleh para peneliti di bidang psikologi pendidikan dan ilmu pembelajaran. Bidang ini memiliki kaitan erat dengan kajian analisis pembelajaran, dimana dua kajian tersebut dibandingkan dan dikontraskan.
Definisi
Penambangan data pendidikan mengacu pada teknik, alat, dan penelitian yang dirancang untuk melakukan ekstraksi makna secara otomatis dari repositori data berukuran besar yang dihasilkan melalui aktivitas pembelajaran manusia dalam konteks lingkungan pendidikan. Seringkali, data pendidikan memiliki sifat ekstensif, terperinci, dan tepat.
Sebagai contoh, sistem manajemen pembelajaran (Learning Management System, LMS) menyimpan log atau catatan informasi aktivitas pengguna, seperti kapan seorang siswa mengakses objek pembelajaran, berapa kali akses yang dilakukan, dan berapa lama objek pembelajaran tersebut ditampilkan di layar komputer pengguna.
Contoh lain, sistem cerdas bimbingan belajar mengentri data setiap kali pelajar menjawab suatu pertanyaan latihan soal. Sistem mencatat kapan waktu penyerahan, apakah jawaban yang diberikan cocok dengan solusi yang diharapkan, jumlah waktu yang telah berlalu sejak pelajar mengirimkan jawaban terakhir, urutan komponen jawaban soal dimasukkan ke dalam antarmuka sistem, dll. Ketepatan data ini sedemikian rupa sehingga bahkan sesi pembelajaran singkat dalam lingkungan pembelajaran berbasis komputer dapat menghasilkan sejumlah besar data untuk dianalisis.
Dalam kasus lain, data yang ada bersifat kurang terperinci. Misalnya, transkrip nilai mahasiswa berisi daftar mata kuliah yang diambil oleh mahasiswa tersebut, nilai yang diperoleh siswa dalam setiap mata kuliah, dan kapan siswa tersebut memilih atau mengubah jurusan akademiknya. Penambangan data pendidikan memanfaatkan kedua jenis data untuk menemukan ragam informasi penting tentang berbagai tipe pelajar dan cara mereka belajar, struktur domain pengetahuan, dan pengaruh strategi pembelajaran dalam konteks lingkungan pembelajaran tertentu.
Analisis-analisis seperti ini menghasilkan informasi baru yang sulit dilihat dari sekedar data mentah. Misalnya, analisis data LMS dapat menunjukkan hubungan antara objek pembelajaran dan nilai akhir kursus. Demikian pula, analisis data transkrip nilai mahasiswa dapat mengungkapkan hubungan antara nilai mahasiswa dalam mata kuliah tertentu dan keputusan mereka untuk melakukan pindah jurusan. Informasi tersebut memberikan wawasan mengenai desain lingkungan pembelajaran, yang memungkinkan siswa, guru, administrator sekolah, dan pembuat kebijakan pendidikan untuk membuat keputusan dalam mengelola sumber daya pendidikan.
Sejarah
Meskipun kajian analisis data pendidikan sudah ada sebelumnya, ragam perkembangan bidang teknologi pendidikan, seperti dalam peningkatan daya komputasi dan kemampuan untuk mencatat data secara terperinci mengenai penggunaan lingkungan pembelajaran berbasis komputer oleh siswa, telah menyebabkan meningkatnya minat dalam riset pengembangan teknik analisis data dalam jumlah yang besar dalam lingkungan pendidikan. Minat ini terejawantah dalam serangkaian lokakarya EDM yang diselenggarakan dari tahun 2000 hingga 2007 sebagai bagian dari beberapa konferensi penelitian internasional. Pada tahun 2008, sekelompok peneliti memulai konferensi penelitian internasional tahunan tentang EDM, dengan konferensi pertama berlangsung di kota Montreal, Quebec, Kanada.
Karena minat terhadap kajian EDM terus meningkat, para peneliti dalam bidang EDM mendirikan the Journal of Educational Data Mining pada tahun 2009 sebagai sarana komunikasi ilmiah dan diseminasi hasil kajian EDM. Pada tahun 2011, para peneliti EDM mendirikan International Educational Data Mining Society untuk membangun jaringan peneliti EDM dan memperkuat pengembangan bidangnya.
Dengan diperkenalkannya repositori data pendidikan publik, seperti DataShop dari Pittsburgh Science of Learning Centre (PSLC) pada tahun 2008 dan National Center for Education Statistics (NCES), set data publik memfasilitasi kajian penambangan data pendidikan yang lebih mudah diakses dan layak pakai, sehingga kontribusi dalam kajian EDM semakin meningkat.
Sasaran
Ryan S.Baker dan Kalina Yacef merumuskan empat tujuan dari kegiatan penambangan data pendidikan:
Menghasilkan prediksi perilaku belajar pelajar – Tujuan ini dapat dicapai dengan pemodelan data pelajar yang menciptakan model pelajar yang menggabungkan karakteristik pelajar, termasuk informasi rinci seperti pengetahuan, perilaku dan motivasi belajar. Pengalaman pengguna pelajar dan kepuasan mereka secara keseluruhan terhadap pembelajaran juga diukur melalui pemodelan data pelajar ini.
Menemukan atau meningkatkan model domain – Melalui ragam metode dan penerapan EDM, penemuan model baru dan perbaikan pada model yang sudah ada dapat dilakukan. Contohnya termasuk menyediakan ilustrasi konten pendidikan untuk melibatkan pelajar dan menentukan urutan pembelajaran yang optimal untuk mendukung gaya belajar pelajar.
Mengkaji dampak dukungan pendidikan yang dapat dicapai melalui sistem pembelajaran.
Memajukan pengetahuan ilmiah tentang pembelajaran dan pembelajar dengan membangun dan menggabungkan model data pelajar, bidang penelitian EDM serta teknologi dan perangkat lunak yang digunakan.
Pengguna dan pemangku kepentingan
Terdapat empat pengguna dan pemangku kepentingan utama yang terlibat dalam aktivitas penambangan data pendidikan, yaitu:
Pelajar – Pelajar tertarik untuk memahami kebutuhan mereka dan metode untuk meningkatkan pengalaman dan kinerja mereka. Misalnya, pelajar juga bisa mendapatkan wawasan dari informasi yang dihasilkan oleh metode dan teknik EDM untuk memberikan masukan aktivitas dan sumber daya yang dapat digunakan berdasarkan interaksi mereka dengan alat pembelajaran daring dan wawasan dari pelajar sebelumnya atau yang serupa dengannya. Untuk tingkatan pelajar yang lebih muda, EDM juga dapat memberikan informasi kepada orang tua tentang progres belajar anak mereka. EDM dapat memberikan rekomendasi penting untuk mengelompokkan pelajar secara efektif dalam lingkungan daring. Tantangannya adalah menggunakan data yang kompleks untuk mempelajari dan menafsirkan kelompok-kelompok ini melalui pengembangan model yang dapat ditindaklanjuti.
Pengajar – Pengajar semestinya berupaya memahami proses pembelajaran dan metode yang dapat digunakan untuk meningkatkan proses pengajaran mereka. Pendidik dapat menggunakan aplikasi EDM untuk membantu mereka dalam menyusun kurikulum, menentukan metode terbaik untuk menyampaikan pelajaran, dan merekomendasikan alat yang dapat digunakan untuk melibatkan peserta didik untuk meningkatkan hasil pembelajaran. Penyulingan data untuk teknik penilaian manusia memberikan peluang bagi pengajar untuk memanfaatkan EDM untuk mengidentifikasi dengan cepat pola perilaku pelajar, yang dapat mendukung metode pengajaran mereka selama durasi aktivitas pembelajaran atau untuk meningkatkan pengajaran mereka di masa depan. Menggunakan EDM, pengajar dapat menentukan ragam indikator yang menunjukkan kepuasan dan keterlibatan siswa terhadap materi pelajaran, dan juga memantau kemajuan pembelajaran.
Peneliti – Peneliti fokus dalam pengembangan dan evaluasi teknik penambangan data untuk meningkatkan efektivitas metode maupun kualitas data. Konferensi internasional tahunan bagi para peneliti dimulai pada tahun 2008 untuk mendiskusikan macam topik dalam EDM. Topik-topik ini berkisar dari penggunaan data mining untuk meningkatkan efektivitas institusi hingga kinerja pelajar.
Tata Usaha Institusi Pembelajaran – Tata usaha institusi pembelajaran memiliki tanggung jawab dalam mengalokasikan sumber daya institusi pembelajaran. Ketika institusi semakin bertanggung jawab atas keberhasilan siswa, pengelolaan aplikasi EDM menjadi lebih umum di lingkungan pendidikan. Staf pengajar dan penasihat menjadi lebih proaktif dalam mengidentifikasi dan menangani siswa yang berisiko. Namun, terkadang menjadi tantangan untuk menyampaikan informasi kepada pengambil keputusan agar dapat mengelola aplikasi secara tepat waktu dan efisien.
Fase-fase
Seiring dengan berkembangnya kajian di bidang penambangan data pendidikan, bermunculan ragam teknik penambangan data yang diterapkan pada ragam konteks pendidikan. Pada tiap kasus, tujuan dari aktivitas penambangan data adalah melakukan interpretasi pada data mentah untuk mendapatkan informasi bermakna mengenai proses pembelajaran yang kemudian digunakan untuk membuat keputusan yang lebih baik tentang desain dan lintasan lingkungan pembelajaran. Secara umum, aktivitas penambangan data pendidikan terdiri dari empat fase:
Fase pertama dari proses penambangan data pendidikan (dengan mengabaikan tahap pra-pemrosesan) adalah menemukan hubungan dalam data. Hal ini melibatkan pencarian melalui gudang data dari lingkungan pendidikan dengan tujuan menemukan hubungan yang konsisten antar variabel . Beberapa algoritma untuk mengidentifikasi hubungan tersebut telah digunakan, antara lain klasifikasi, regresi, pengelompokan, analisis faktor, analisis jaringan sosial, penambangan aturan asosiasi, dan penambangan pola sekuensial .
Hubungan yang ditemukan kemudian harus divalidasi untuk menghindari terjadinya overfitting .
Hubungan yang telah divalidasi kemudian diterapkan untuk membuat prediksi tentang kejadian masa depan di lingkungan pembelajaran.
Prediksi digunakan untuk mendukung proses pengambilan keputusan dan pengambilan kebijakan.
Selama fase 3 dan 4, data disajikan dalam bentuk visualisasi atau dalam bentuk lain untuk agar dapat dibaca oleh manusia. Sejumlah besar penelitian dalam bidang penambangan data pendidikan telah dilakukan untuk mencari praktik terbaik dalam melakukan visualisasi data .
Pendekatan utama
Dalam kajian penambangan data secara umum, metode prediksi, pengelompokan, dan penambangan hubungan dianggap sebagai metode universal. Namun, dalam kajian penambangan data pendidikan, metode Penemuan dengan Model dan Distilasi Data untuk Penilaian Manusia dianggap sebagai pendekatan yang lebih menonjol.
= Penemuan dengan model (discovery with models)
=Dalam metode penemuan dengan model, suatu model dikembangkan melalui prediksi, pengelompokan atau rekayasa pengetahuan penalaran manusia dan kemudian digunakan sebagai komponen dalam analisis lain, yaitu dalam prediksi dan penambangan hubungan. Dalam penggunaan metode prediksi, prediksi model menentukan variabel baru.
Untuk pemanfaatan penambangan relasional, model yang dikembangkan memungkinkan proses analisis antara prediksi baru dan variabel tambahan. Dalam ragam kasus, penemuan dengan model menggunakan model prediksi yang telah divalidasi dan telah terbukti dapat digeneralisasikan di seluruh konteks.
Penerapan utama metode ini mencakup dalam kasus penemuan hubungan antara perilaku pelajar, karakteristik pelajar dan variabel kontekstual lain dalam lingkungan pembelajaran. Penemuan lebih lanjut atas permasalahan penelitian yang lebih luas dan spesifik dalam berbagai konteks juga dapat dieksplorasi dengan menggunakan metode ini.
= Penyulingan data untuk penilaian manusia (Distillation of data for human judgment)
=Manusia dapat melakukan inferensi tentang data yang mungkin berada di luar cakupan yang disediakan oleh metode penambangan data otomatis. Dalam kajian penambangan data pendidikan, data disaring (disuling atau didistilasi) untuk penilaian manusia dengan dua tujuan utama, identifikasi dan klasifikasi.
Untuk tujuan identifikasi, data disaring dengan tujuan memungkinkan manusia melakukan identifikasi pola-pola yang diketahui, yang mungkin sulit untuk ditafsirkan. Misalnya, dalam perumusan kurva pembelajaran, kajian umum dalam dunia pendidikan, ditentukan pola yang secara jelas mencerminkan hubungan antara pembelajaran dan pengalaman pelajar dalam periode waktu tertentu.
Data juga disaring untuk tujuan klasifikasi fitur data, yang digunakan untuk mendukung pengembangan model prediksi. Klasifikasi sangat membantu mempercepat pengembangan model prediksi.
Tujuan dari metode ini adalah untuk merangkum dan menyajikan informasi dari data pendidikan dalam bentuk yang bermanfaat, interaktif dan menarik secara visual untuk mendukung proses pengambilan keputusan dalam lingkungan pendidikan. Secara spesifik, metode ini memiliki manfaat bagi pengajar dalam memahami informasi penggunaan sistem belajar dan efektivitas sistem dalam kegiatan pembelajaran. Penerapan utama penyulingan data untuk penilaian manusia mencakup identifikasi pola pembelajaran siswa, perilaku, peluang kolaborasi, dan pelabelan data untuk digunakan oleh model prediksi.
Aplikasi
Cristobal Romero dan Sebastian Ventura mendaftarkan aplikasi dari penambangan data pendidikan. Dalam taksonominya, bidang penerapan EDM adalah:
Analisis dan visualisasi data
Menyediakan umpan balik untuk instruktur pengajar
Rekomendasi untuk pelajar
Prediksi kinerja pelajar
Pemodelan data pelajar
Deteksi dini perilaku pelajar yang tidak diinginkan
Pengelompokkan pelajar
Analisis jaringan sosial
Mengembangkan peta konsep (concept maps)
Membangun perangkat pelajaran – EDM dapat diterapkan pada sistem manajemen kursus seperti Moodle yang bersifat sumber-terbuka. Moodle berisi data penggunaan yang mencakup berbagai aktivitas pengguna seperti hasil tes, jumlah pembacaan yang diselesaikan dan partisipasi dalam forum diskusi. Alat penambangan data pendidikan dapat digunakan untuk menyesuaikan aktivitas pembelajaran tiap pengguna dan dapat disesuaikan dengan kecepatan siswa menyelesaikan kursus. Hal ini khususnya bermanfaat untuk pembelajaran daring dengan berbagai tingkat kompetensi.
Perencanaan dan penjadwalan
Penelitian baru mengenai lingkungan pembelajaran seluler menunjukkan bahwa penambangan data pendidikan dapat bermanfaat secara lebih luas. Penambangan data pendidikan dapat digunakan untuk membantu menyediakan konten yang telah dipersonalisasi untuk kebutuhan pengguna seluler, meskipun terdapat perbedaan mutlak dalam pengelolaan konten dalam perangkat seluler dan komputer pribadi standar serta peramban web .
Pemanfaatan penambangan data pendidikan yang baru akan berfokus dalam memungkinkan pengguna dengan kemampuan non-teknis menggunakan dan terlibat dalam pengembangan teknik, metode, dan aktivitas penambangan data, menjadikan pengumpulan dan pemrosesan data lebih mudah diakses oleh semua pengguna. Contohnya termasuk alat statistik dan visualisasi yang menganalisis jaringan sosial dan pengaruhnya terhadap hasil pembelajaran dan produktivitas.
Kursus
Pada bulan Oktober 2013, situs pembelajaran daring Coursera menawarkan kursus daring terbuka mengenai "Big Data dalam Pendidikan" dengan topik mengajarkan bagaimana dan kapan menggunakan metode utama untuk penambangan data pendidikan. Kursus ini kemudian dipindahkan ke platform edX pada musim panas tahun 2015, dan terus dijalankan di platform edX sejak saat itu. Kursus tersebut telah diarsipkan dan sekarang tersedia daring.
Teachers College, Universitas Columbia menawarkan jenjang pendidikan magister sains (MS) dalam bidang kajian Analisis Pembelajaran.
Tempat-tempat publikasi
Sejumlah besar hasil kajian mengenai penambangan data pendidikan diterbitkan pada the International Conference on Educational Data Mining, yang diselenggarakan oleh the International Educational Data Mining Society.
1st International Conference on Educational Data Mining (2008) – Montreal, Kanada
2nd International Conference on Educational Data Mining (2009) – Cordoba, Spanyol
3rd International Conference on Educational Data Mining (2010) – Pittsburgh, PA, Amerika Serikat
4th International Conference on Educational Data Mining (2011) – Eindhoven, Negeri Belanda
5th International Conference on Educational Data Mining (2012) – Chania, Yunani
6th International Conference on Educational Data Mining (2013) – Memphis, TN, Amerika Serikat
7th International Conference on Educational Data Mining (2014) – London, Inggris Raya
8th International Conference on Educational Data Mining] (2015) – Madrid, Spanyol
9th International Conference on Educational Data Mining] (2016) – Raleigh, NC, Amerika Serikat
10th International Conference on Educational Data Mining] (2017) – Wuhan, China
11th International Conference on Educational Data Mining] (2018) – Buffalo, NY, Amerika Serikat
12th International Conference on Educational Data Mining] (2019) – Montréal, QC, Kanada
13th International Conference on Educational Data Mining] (2020) – Daring
14th International Conference on Educational Data Mining (2021) – Paris, Perancis
Makalah-makalah dengan topik penambangan data pendidikan juga dipublikasikan di the Journal of Educational Data Mining (JEDM).
Terdapat ragam makalah mengenai penambangan data pendidikan yang rutin diterbitkan dalam konferensi terkait, seperti Artificial Intelligence and Education, Intelligent Tutoring Systems, dan User Modeling, Adaptation, and Personalization .
Pada tahun 2011, penerbit Chapman & Hall / CRC Press, Taylor dan Francis Group menerbitkan Buku Pegangan Penambangan Data Pendidikan (the Handbook of Educational Data Mining) untuk pertama kali. Referensi ini diperuntukkan bagi mereka yang tertarik untuk berpartisipasi dalam komunitas penambangan data pendidikan.
Kontes-kontes
Pada tahun 2010, kejuaraan KDD Cup yang diselenggarakan oleh Association for Computing Machinery (ACM) menggunakan data dari lingkungan pendidikan. Set data disediakan oleh DataShop, dan terdiri dari lebih dari 1.000.000 tupel data dari pelajar yang menggunakan aplikasi tutor kognitif. Enam ratus tim bersaing untuk mendapatkan hadiah uang lebih dari US$8.000 (berasal dari hibah Facebook). Tugas para kontestan adalah merancang suatu algoritma yang, setelah belajar dari data yang disediakan, akan membuat prediksi paling akurat dari data baru. Para pemenang mengirimkan algoritma yang memanfaatkan pembuatan fitur (suatu bentuk pembelajaran representasi), random forest, dan jaringan Bayesian .
Biaya dan tantangan
Seiring dengan kemajuan teknologi, terdapat beban biaya dan tantangan dalam melakukan aktivitas penambangan data pendidikan. Tantangan ini termasuk biaya untuk penyimpanan data log dan biaya perekrutan staf yang berdedikasi untuk mengelola sistem. Selain itu, dalam beberapa kasus, sistem data mungkin tidak selalu terintegrasi dengan mulus antara satu sama lain meskipun telah didukung dengan perangkat statistik dan visualisasi lain. Hal ini membuat upaya menyediakan satu versi data yang sederhana menjadi sulit. Selain itu, memilih data mana yang akan ditambang dan dianalisis juga merupakan suatu tantangan tersendiri, sehingga membuat fase awal penambangan memakan waktu dan tenaga yang besar. Dari awal hingga akhir, strategi dan implementasi penambangan data pendidikan mengharuskan seseorang untuk menjunjung privasi dan etika bagi seluruh pemangku kepentingan yang terlibat.
Kritik
Generalisasi – Kajian penambangan data pendidikan bersifat spesifik pada lingkungan pendidikan tertentu dan waktu di mana penelitian tersebut dilakukan, dan oleh karena itu, tidak dapat selalu digeneralisasikan ke institusi maupun lingkungan pembelajaran lain. Penelitian juga menunjukkan bahwa bidang penambangan data pendidikan lebih dijajaki di negara-negara dan budaya Barat. Hal ini membuat negara dan budaya lain mungkin tidak terwakili dalam penelitian dan temuan kajian. Pengembangan model masa depan harus mempertimbangkan penerapan dalam berbagai konteks.
Privasi – Privasi individu terus menjadi perhatian dalam penerapan perangkat penambangan data pendidikan. Dengan adanya perangkat yang terbuka, mudah diakses, dan mudah digunakan di pasaran, para pelajar dan keluarga mereka mungkin menghadapi risiko akibat informasi yang diberikan siswa ke sistem pembelajaran, dengan harapan menerima umpan balik yang bermanfaat bagi kinerja mereka di masa depan. Ketika pengguna semakin memiliki pemahaman mengenai hal privasi daring, administrator perangkat penambangan data pendidikan harus bersikap proaktif dalam melindungi privasi penggunanya dan transparan tentang bagaimana dan dengan siapa informasi tersebut akan digunakan dan dibagikan. Pengembangan perangkat penambang data pendidikan harus mempertimbangkan perlindungan privasi individu sambil tetap memajukan penelitian di bidang ini.
Plagiarisme – Deteksi plagiarisme merupakan tantangan berkelanjutan bagi para pendidik dan pengajar baik luring maupun daring. Namun, karena kompleksitas yang terkait dengan pendeteksian dan pencegahan plagiarisme digital pada khususnya, alat penambangan data pendidikan saat ini tidak cukup canggih untuk mengatasi masalah ini secara akurat. Oleh karena itu, pengembangan kemampuan prediktif dalam isu-isu terkait plagiarisme harus menjadi fokus penelitian di masa depan.
Adopsi – Tidak diketahui seberapa luas adopsi aktivitas penambangan data pendidikan dan sejauh mana ragam institusi telah menerapkannya atau mempertimbangkan penerapan strategi penambangan data pendidikan. Oleh karena itu, tidak jelas apakah ada hambatan yang menghalangi pengguna untuk mengadopsi proses penambangan data pendidikan di lingkungan pendidikan mereka.
Referensi
Kata Kunci Pencarian:
- Penambangan data pendidikan
- Hashim Djojohadikusumo
- Australia
- Pulau Obi
- Sistem informasi geografis
- Pramono Anung
- Kota Sawahlunto
- Papua Tengah
- Kota Banjarmasin
- Freeport Indonesia
- Central Papua