Minería de datos educativos con algoritmos de regresión: un estudio sobre predicción del rendimiento

Autores/as

DOI:

https://doi.org/10.15536/reducarmais.6.2022.2691

Palabras clave:

Minería de datos educativos, Aprendizaje automático, Algoritmos de regresión, Predicción de rendimiento

Resumen

Con la creciente disponibilidad de datos, especialmente en el contexto educativo, Educational Data Mining (DEM) se ha vuelto cada vez más importante para la toma de decisiones en este contexto. Uno de los principales objetivos del MDE es la predicción del desempeño, porque cuando se conoce de antemano el desempeño de los estudiantes, es posible intervenir, evitando fracasos e incluso deserciones. En este sentido, este estudio tiene como objetivo predecir el desempeño de los estudiantes, en un conjunto de datos públicos, utilizando algoritmos de Regresión, además de indicar los principales atributos predictivos del desempeño de los estudiantes. Para ello, se implementó un proceso MDE basado en 4 pasos descritos por Aggarwal (2015). Como resultado, se identificó que para los dos conjuntos de datos analizados, Decision Trees fue el más preciso, con una precisión del 90% para la asignatura de Matemáticas, y Random Forest tuvo el mejor desempeño para los datos referidos a la asignatura portuguesa. 80% de precisión. Además, se encontró que los atributos relacionados con las actividades escolares son más predictores del desempeño del estudiante, sin embargo algunos atributos resultantes de las características demográficas y socioeconómicas también influyen en el desempeño.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Vanessa Faria de Souza, Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul - IFRS

Doutoranda no PPGIE (Programa de Pós-Graduação em Informática na Educação) da Universidade Federal do Rio Grande do Sul (UFRGS). Mestre em Informática pelo PPGI (Programa de Pós-Graduação em Informática) da Universidade Tecnológica Federal do Paraná (UTFPR), na área de Computação Aplicada, e ênfase em Engenharia de Software. Possuo especialização em Educação Especial Inclusiva, com ênfase em Tecnologia Assistiva. Sou graduada em Sistemas de Informação pela Universidade Estadual do Norte do Paraná (2011). Completei a Licenciatura em Matemática, pela UTFPR. Atualmente sou docente dedicação exclusiva no Instituto Federal do Rio Grande do Sul, Campus Ibirubá, estou em afastamento para a realização do Doutorado. Ministro aulas nos Cursos de Ciência da Computação, Técnico em Informática Integrado do Ensino Médio, Licenciatura em Matemática e Especialização em Ensino de Linguagens e suas Tecnologias. Também já atuei como Professora do Magistério Superior na Universidade Estadual do Norte do Paraná (UENP) nos cursos de Graduação Ciência da Computação e Sistemas de informação, nas disciplinas de Sistemas Digitais, Projeto e Análise de Algoritmo, Tópicos Avançados em Computação, Computação Simbólica e Numérica, Metodologia Científica. Assim como na UTFPR. Também já atuei como professora de Matemática no Ensino Básico.

Prof. Dr. Sílvio Cézar Cazella, Universidade Federal de Ciências da Saúde de Porto Alegre

Sílvio César Cazella completó su doctorado en Ciencias de la Computación en la Universidad Federal de Rio Grande do Sul en 2006, habiendo completado su doctorado "sándwich" en la Universidad de Alberta en Canadá. Magíster en Ciencias de la Computación de la Universidad Federal de Rio Grande do Sul en 1997. Licenciado en Ciencias de la Computación de la Pontificia Universidad Católica de Rio Grande do Sul en 1993. Actualmente es Profesor Asociado - Nivel II en la Universidad Federal de Ciencias de la Salud en Puerto alegre. Profesor Efectivo del Programa de Posgrado en Educación para la Salud (UFCSPA), Profesor Efectivo del Programa de Posgrado en Tecnologías de la Información y Gestión de la Salud (UFCSPA), colaborador del Programa de Posgrado en Ciencias de la Salud (UFCSPA) y colaborador del Programa de Posgrado en Informática en Educación (UFRGS). En su currículum Lattes, los términos más frecuentes en el contexto de la producción científica, tecnológica y artístico-cultural son: Sistemas de Recomendación, Minería de Datos, Ingeniería de Software, Sistemas Multi-Agente, Minería de Datos, Inteligencia Artificial, Sistemas Especializados, Data Warehouse, Educación. a Distancia, Informática en Educación y Educación Continuada. Se desempeña como Analista y Diseñador (arquitectura) de Sistemas de Información Estructurados y Orientados a Objetos, como Analista de Negocios y como consultor en empresas en el campo de las Tecnologías de la Información. Tiene TOEFL, IELTS en inglés y DELE en español.

Citas

AGGARWAL, C. C. (2015). Data Mining: The Textbook. 1. ed. New York, USA: Springer. E-book. Disponível em:< https://doi.org/10.1007/978-3-319-14142-8>.

ALMASRI, A.; CELEBI, E.; ALKHAWALDEH, R.S. (2019). EMT: ensemble meta-based tree model for predicting student performance. Scientific Programming, v. 19, p. 1-14. Disponível em: <https://doi.org/10.1155/2019/3610248>.

BAKER, R.; ISOTANI, S.; CARVALHO, A. (2011). Mineração de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informática na Educação, v. 19, n. 2, p. 3–13. Disponível em: <https://doi.org/10.5753/rbie.2011.19.02.03>.

BAKER, R. S.; INVENTADO, P. S. (2014). Educational Data Mining and Learning Analytics. In: J.A. Larusson and B. White (EDS.) (org.). Learning Analytics: From Research to Practice. 1. ed. New York, USA: Springer, 1–195. E-book. Disponível em: <https://doi.org/10.1007/978-1-4614-3305-7>.

BAKER, R. S. J. D. (2015). Big data and education. 2. ed. New York, USA: A Massive Online Open Textbook (MOOT) - Teachers College, Columbia University. Disponível em: <http://www.columbia.edu/~rsb2162/bigdataeducation.html>.

CORTEZ, P.; SILVA, A. (2008). Using Data Mining to Predict Secondary School Student Performance. In A. Brito and J. Teixeira Eds., Proceedings of 5th FUture BUsiness TEChnology Conference (FUBUTEC 2008). Disponível em: <http://www3.dsi.uminho.pt/pcortez/student.pdf>.

DABHADE, P.; AGARWAL, R.; ALAMEEN, K. P.; FATHIMA, A. T.; SRIDHARAN, R.; GOPAKUMAR, G. (2021). Educational data mining for predicting students’ academic performance using machine learning algorithms. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.646>.

MALINI, J.; KALPANA, Y. (2021). Investigation of factors affecting student performance evaluation using education materials data mining technique. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.026>.

MDE. Sociedade Internacional de Mineração de Dados Educacionais. (2020). Disponível em: <http://educationaldatamining.org/>. Acesso em: 15 set. 2021.

JAPKOWICZ, N.; SHAH, M. (2014). Evaluating Learning Algorithms: A Classification Perspective. 1a Ed. ed. Cambridge, E-book. Disponível em: <https://dl.acm.org/doi/book/10.5555/1964882>.

KUBAT, M. (2017). An Introduction to Aprendizagem de Máquina. 2. ed. Coral Gables, FL, USA: Springer. E-book. Disponível em: <https://doi.org/10.1007/978-3-319-63913-0>.

RIESTRA-GONZÁLEZ, M.; PAULE-RUÍZ, M. DEL P.; ORTIN, F. (2021). Massive LMS log data analysis for the early prediction of course-agnostic student performance. Computers & Education, v. 163, p. 1-20. Disponível em: <https://doi.org/10.1016/j.compedu.2020.104108>.

ROMERO, C.; VENTURA, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 3, n. 1, p. 12–27. Disponível em: <https://doi.org/10.1002/widm.1075>.

ROMERO, C.; VENTURA, S. (2020). Educational data mining and learning analytics: An updated survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 10, n. 3, p. 1–21. Disponível em: <https://doi.org/10.1002/widm.1355>.

SHAHIRI, A. M.; HUSAIN, W.; RASHID, N. A. (2015). A Review on Predicting Student’s Performance Using Data Mining Techniques. Procedia Computer Science, v. 72, p. 414–422. Disponível em: <https://doi.org/10.1016/j.procs.2015.12.157>.

SINGH, R.; PAL, S. (2020). Machine learning algorithms and ensemble technique to improve prediction of students performance. International Journal of Advanced Trends in Computer Science and Engineering, v. 9, n. 3, p. 3970-3976. Disponível em: <https://doi.org/10.30534/ijatcse/2020/221932020>.

SOUZA, V. F.; PERRY, G. T. (2020). Tendências de Pesquisas em Mineração de Dados Educacionais em MOOCs: um Mapeamento Sistemático. Revista Brasileira de Informática na Educação, v. 28, p. 491-508. Disponível em: <http://dx.doi.org/10.5753/rbie.2020.28.0.491>.

TALAL, H.; SAEED, S. (2019) A study on adoption of data mining techniques to analyze academic performance. ICIC Express Letters, Part B: Applications, v. 10, n. 8, p. 681-687. Disponível em: <http://doi.org/10.24507/icicelb.10.08.681>.

YAACOB, W. F. W.; NASIR, S. A. M; YAACOB, W. F. W.; SOBRI, N. M. (2019). Supervised data mining approach for predicting student performance. Indonesian Journal of Electrical Engineering and Computer Science, v. 16, n. 3, p. 1584- 1592. Disponível em: <http://doi.org/10.11591/ijeecs.v16.i3.pp1584-1592>.

Publicado

2022-02-18

Cómo citar

Faria de Souza, V., & Cazella, S. C. (2022). Minería de datos educativos con algoritmos de regresión: un estudio sobre predicción del rendimiento. Educar Mais, 6, 183–198. https://doi.org/10.15536/reducarmais.6.2022.2691

Número

Sección

Artículos