Minería de datos educativos con algoritmos de regresión: un estudio sobre predicción del rendimiento
DOI:
https://doi.org/10.15536/reducarmais.6.2022.2691Palabras clave:
Minería de datos educativos, Aprendizaje automático, Algoritmos de regresión, Predicción de rendimientoResumen
Con la creciente disponibilidad de datos, especialmente en el contexto educativo, Educational Data Mining (DEM) se ha vuelto cada vez más importante para la toma de decisiones en este contexto. Uno de los principales objetivos del MDE es la predicción del desempeño, porque cuando se conoce de antemano el desempeño de los estudiantes, es posible intervenir, evitando fracasos e incluso deserciones. En este sentido, este estudio tiene como objetivo predecir el desempeño de los estudiantes, en un conjunto de datos públicos, utilizando algoritmos de Regresión, además de indicar los principales atributos predictivos del desempeño de los estudiantes. Para ello, se implementó un proceso MDE basado en 4 pasos descritos por Aggarwal (2015). Como resultado, se identificó que para los dos conjuntos de datos analizados, Decision Trees fue el más preciso, con una precisión del 90% para la asignatura de Matemáticas, y Random Forest tuvo el mejor desempeño para los datos referidos a la asignatura portuguesa. 80% de precisión. Además, se encontró que los atributos relacionados con las actividades escolares son más predictores del desempeño del estudiante, sin embargo algunos atributos resultantes de las características demográficas y socioeconómicas también influyen en el desempeño.
Descargas
Citas
AGGARWAL, C. C. (2015). Data Mining: The Textbook. 1. ed. New York, USA: Springer. E-book. Disponível em:< https://doi.org/10.1007/978-3-319-14142-8>.
ALMASRI, A.; CELEBI, E.; ALKHAWALDEH, R.S. (2019). EMT: ensemble meta-based tree model for predicting student performance. Scientific Programming, v. 19, p. 1-14. Disponível em: <https://doi.org/10.1155/2019/3610248>.
BAKER, R.; ISOTANI, S.; CARVALHO, A. (2011). Mineração de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informática na Educação, v. 19, n. 2, p. 3–13. Disponível em: <https://doi.org/10.5753/rbie.2011.19.02.03>.
BAKER, R. S.; INVENTADO, P. S. (2014). Educational Data Mining and Learning Analytics. In: J.A. Larusson and B. White (EDS.) (org.). Learning Analytics: From Research to Practice. 1. ed. New York, USA: Springer, 1–195. E-book. Disponível em: <https://doi.org/10.1007/978-1-4614-3305-7>.
BAKER, R. S. J. D. (2015). Big data and education. 2. ed. New York, USA: A Massive Online Open Textbook (MOOT) - Teachers College, Columbia University. Disponível em: <http://www.columbia.edu/~rsb2162/bigdataeducation.html>.
CORTEZ, P.; SILVA, A. (2008). Using Data Mining to Predict Secondary School Student Performance. In A. Brito and J. Teixeira Eds., Proceedings of 5th FUture BUsiness TEChnology Conference (FUBUTEC 2008). Disponível em: <http://www3.dsi.uminho.pt/pcortez/student.pdf>.
DABHADE, P.; AGARWAL, R.; ALAMEEN, K. P.; FATHIMA, A. T.; SRIDHARAN, R.; GOPAKUMAR, G. (2021). Educational data mining for predicting students’ academic performance using machine learning algorithms. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.646>.
MALINI, J.; KALPANA, Y. (2021). Investigation of factors affecting student performance evaluation using education materials data mining technique. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.026>.
MDE. Sociedade Internacional de Mineração de Dados Educacionais. (2020). Disponível em: <http://educationaldatamining.org/>. Acesso em: 15 set. 2021.
JAPKOWICZ, N.; SHAH, M. (2014). Evaluating Learning Algorithms: A Classification Perspective. 1a Ed. ed. Cambridge, E-book. Disponível em: <https://dl.acm.org/doi/book/10.5555/1964882>.
KUBAT, M. (2017). An Introduction to Aprendizagem de Máquina. 2. ed. Coral Gables, FL, USA: Springer. E-book. Disponível em: <https://doi.org/10.1007/978-3-319-63913-0>.
RIESTRA-GONZÁLEZ, M.; PAULE-RUÍZ, M. DEL P.; ORTIN, F. (2021). Massive LMS log data analysis for the early prediction of course-agnostic student performance. Computers & Education, v. 163, p. 1-20. Disponível em: <https://doi.org/10.1016/j.compedu.2020.104108>.
ROMERO, C.; VENTURA, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 3, n. 1, p. 12–27. Disponível em: <https://doi.org/10.1002/widm.1075>.
ROMERO, C.; VENTURA, S. (2020). Educational data mining and learning analytics: An updated survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 10, n. 3, p. 1–21. Disponível em: <https://doi.org/10.1002/widm.1355>.
SHAHIRI, A. M.; HUSAIN, W.; RASHID, N. A. (2015). A Review on Predicting Student’s Performance Using Data Mining Techniques. Procedia Computer Science, v. 72, p. 414–422. Disponível em: <https://doi.org/10.1016/j.procs.2015.12.157>.
SINGH, R.; PAL, S. (2020). Machine learning algorithms and ensemble technique to improve prediction of students performance. International Journal of Advanced Trends in Computer Science and Engineering, v. 9, n. 3, p. 3970-3976. Disponível em: <https://doi.org/10.30534/ijatcse/2020/221932020>.
SOUZA, V. F.; PERRY, G. T. (2020). Tendências de Pesquisas em Mineração de Dados Educacionais em MOOCs: um Mapeamento Sistemático. Revista Brasileira de Informática na Educação, v. 28, p. 491-508. Disponível em: <http://dx.doi.org/10.5753/rbie.2020.28.0.491>.
TALAL, H.; SAEED, S. (2019) A study on adoption of data mining techniques to analyze academic performance. ICIC Express Letters, Part B: Applications, v. 10, n. 8, p. 681-687. Disponível em: <http://doi.org/10.24507/icicelb.10.08.681>.
YAACOB, W. F. W.; NASIR, S. A. M; YAACOB, W. F. W.; SOBRI, N. M. (2019). Supervised data mining approach for predicting student performance. Indonesian Journal of Electrical Engineering and Computer Science, v. 16, n. 3, p. 1584- 1592. Disponível em: <http://doi.org/10.11591/ijeecs.v16.i3.pp1584-1592>.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Vanessa Faria de Souza, Sílvio Cézar Cazella
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
DECLARACIÓN DE RESPONSABILIDAD: Certifico que participé de la concepción del trabajo, en parte o en la íntegra, que no omití cualesquiera ligaciones o acuerdos de financiación entre los autores y compañías que puedan tener interés en la publicación de este artículo. Certifico que el texto es original y que el trabajo, en parte o en la íntegra, o cualquier otro trabajo con contenido sustancialmente similar, de mi autoría, no fue enviado a otra revista y no lo será mientras su publicación esté siendo considerada por la Revista Educar Mais, sea en formato impreso o electrónico.
El autor responsable por el envío del trabajo representa todos los autores del mismo y, al enviar el artículo para la revista, está garantizando que tiene el permiso de todos para hacerlo. Del mismo modo, asegura que el artículo no viola derechos autorales y que no hay plágio en el trabajo. La revista no se responsabiliza por las opiniones emitidas.
La Revista Educar Mais es de acceso abierto (Open Access), sin que haya la necesidad de pagos de tasas, sea para submisión o procesamiento de los artículos. La revista adopta la definición de Budapest Open Access Initiative (BOAI), o sea, los usuarios poseen el derecho de leer, bajar, copiar, distribuir, imprimir, buscar y hacer links directos para los textos completos de los artículos en ella publicados.
Todos los artículos son publicados con la licencia Creative Commons Atribuição-NãoComercial 4.0 Internacional. Los autores mantienen los derechos autorales sobre sus producciones, debiendo ser contactados directamente si hay interés en uso comercial de los trabajos.