Educational data mining: an analysis on predictors of dropout in Higher Education

Authors

DOI:

https://doi.org/10.15536/reducarmais.9.2025.4120

Keywords:

Educational Data Mining, Machine Learning, Dropout in Higher Education

Abstract

Dropout rates in higher education are a significant challenge for educational institutions, impacting both students and society. This article investigates the main predictors of academic dropout through the application of Educational Data Mining (EDM) techniques. The research uses a data set from a higher education institution, exploring characteristics such as academic performance, socioeconomico profile, student engagement, family data, among others. Machine Learning algorithms were used as Data Mining techniques, which, in addition to enabling the construction of an effective model for predicting student dropout rates, enabled the identification of the most relevant factors to predict dropout rates. The results highlight that variables related to academic performance are the main risk indicators. The conclusions offer insights that can guide institutional strategies to mitigate dropout rates, promoting retention and academic success.

Downloads

Download data is not yet available.

Author Biographies

Felipe Silvestri, Instituto Federal do Rio Grande do Sul - IFRS

Bacharel em Ciência da Computação pelo IFRS campus Ibirubá. Técnico em Informática pelo IFRS campus Ibirubá. Realizou estágio supervisionado em manutenção de computadores. Como bolsista de pesquisa, conduziu um projeto de automação para irrigação automática. Atualmente trabalha na T.I. da Cotribá na parte de infraestrutura de redes.

Vanessa Faria de Souza, Instituto Federal do Rio Grande do Sul - IFRS

Doutora pelo Programa de Pós-Graduação em Informática na Educação (PPGIE) da Universidade Federal do Rio Grande do Sul (UFRGS). Mestre em Informática pelo Programa de Pós-Graduação em Informática (PPGI) da Universidade Tecnológica Federal do Paraná (UTFPR), na área de Computação Aplicada, e com ênfase em Engenharia de Software. Possui Especialização em Educação Especial Inclusiva, com ênfase em Tecnologias Assistivas pela Universidade Estadual do Norte do Paraná (UENP). É graduada em Sistemas de Informação também pela UENP - Bacharel em Sistemas de Informação e Licenciada em Computação. Também Completou a Licenciatura em Matemática no Programa de Formação Pedagógica, pela UTFPR. Atualmente é docente dedicação exclusiva no Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul (IFRS) no Campus Ibirubá. Ministra aulas nos Cursos de Ciência da Computação, Técnico em Informática Integrado do Ensino Médio, Licenciatura em Matemática e Especialização em Ensino de Linguagens e suas Tecnologias. É membro do Grupo de Pesquisa Computação Interdisciplinar Alto Jacuí. Tem interesse nas áreas de Mineração de Dados Educacionais, Learning Analytics, Inteligência Artificial - Machine Learning e Deep Leaning, Sistemas Digitais e Robótica Educacional.

Andrws Vieira, Instituto Federal do Rio Grande do Sul - IFRS

Mestre em Ciência da Computação pela Universidade Federal do Rio Grande do Sul (2015). Bacharel em Ciência da Computação pela Universidade Federal de Pelotas (2012). Técnico em Eletrônica pelo Instituto Federal Sul-rio-grandense(2009). Como pesquisador atuou na área de Ciência da Computação, com ênfase em Software para Sistemas Embarcados, atuando principalmente nos seguintes temas: métricas de software, análise de desempenho, consumo de energia e estimação de requisitos não funcionais a partir do processo de KDD (Knowledge-Discovery in Databases) utilizando como técnica principal de data mining, análise de regressão. Já foi professor no Centro Universitário Ritter dos Reis (UniRitter Porto Alegre/RS), no Centro Universitário (FADERGS Porto Alegre/RS ), no Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul (IFRS) - Campus Viamão/RS e na Escola Maria Rocha (Santa Maria/RS) no curso técnico de Informática. Também exerceu o cargo e Cientista de Dados no Grupo Voalle (Santa Maria/RS), atuando principalmente como engenheiro de dados e machine learning em tópicos como: processamento de linguagem natural (NLP) e deep learning. Atualmente é professor EBTT no IFRS campus Ibirubá.

References

AGGARWAL, Charu C. Data Mining: The Textbook. 1. ed. New York, USA: Springer, 2015. v. 1. E-book. Disponível em: https://doi.org/10.1007/978-3-319-14142-8. Acesso em: 20 dez. 2024.

ALVES, M. de O. P.; GAYDEZKA, B.; CAMPOS, A. de. Projeto para registro e controle da evasão na UFTM. Revista Triângulo, v. 11, n. 1, p. 125–135, 2018.

BAHRAMPOUR, Soheil et al. Comparative Study of Deep Learning Software Frameworks. Cornell Univeristy, v. 3, p. 1–9, 2015.

EDM. Educational Data Mining. 2020. Disponível em: https://educationaldatamining.org/. Acesso em: 26 nov. 2024.

FILHO, R. L. L. e S. et al. A evasão no ensino superior brasileiro. Cadernos de Pesquisa, v. 37, n. 132, p. 641–659, 2007.

FRITSCH, R.; ROCHA, C.; VITELLI, R. F. A evasão nos cursos de graduação em uma instituição de ensino superior privada. Revista Educação em Questão, v. 52, n. 38, p. 81–108, 2015.

GIL, C. A. Como elaborar projetos de pesquisa. 4ª. ed. São Paulo, SP: Atlas, 2002.

HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2ª. ed. California, USA: Springer, 2009.

HEGDE, V. Higher Education Student Dropout Prediction and Analysis through Educational Data Mining. 2018. Disponível em: https://ieeexplore.ieee.org/document/8398887. Acesso em: 20 dez. 2024.

JAPKOWICZ, N.; SHAH, M. Evaluating Learning Algorithms: A Classification Perspective. 1ª. ed. Cambridge, UK: Cambridge, 2014.

LOBO, M. B. C. de M. Panorama da evasão no ensino superior brasileiro: aspectos gerais das causas e soluções Associação Brasileira de Mantenedoras de Ensino Superior. 2012. Disponível em: https://www.institutolobo.org.br/core/uploads/artigos/art_087.pdf. Acesso em: 20 dez. 2024.

MARTINS, M. V. et al. Early Prediction of student’s Performance in Higher Education: A Case Study. 2021. Disponível em: https://link.springer.com/chapter/10.1007/978-3-030-72657-7_16. Acesso em: 20 dez. 2024.

MELLO, S. P. T. de et al. O fenômeno da evasão nos cursos superiores de tecnologia: um estudo de caso em uma universidade pública no sul do Brasil. 2013. Disponível em:https://repositorio.ufsc.br/handle/123456789/113096 . Acesso em: 26 nov. 2023.

MITCHELL, T. M. Machine Learning. 1ª. ed. Nova York, USA: MacGraw-Hill, 1997.

NAVARRO, Pedro J. et al. A machine learning approach to pedestrian detection for autonomous vehicles using high-definition 3D range data. Sensors (Switzerland), v. 17, n. 18, p. 1–20, 2017.

SOUZA, Vanessa Faria; SANTOS, Tony Carlos Bignard dos . Processo de Mineração de Dados Educacionais aplicado na Previsão do Desempenho de Alunos: Uma comparação entre as Técnicas de Aprendizagem de Máquina e Aprendizagem Profunda. Revista Brasileira de Informática na Educação (RBIE), v. 29, p. 519-546, 2021.

SOUZA, V. F. de. Os avanços da mineração de dados educacionais: processo, tendências temáticas e técnicas de mineração. 1ª. ed. Curitiba, PR: Bagai, 2021.

Published

2025-04-05

How to Cite

Silvestri, F., Faria de Souza, V., & Vieira, A. (2025). Educational data mining: an analysis on predictors of dropout in Higher Education. Educar Mais, 9, 1–23. https://doi.org/10.15536/reducarmais.9.2025.4120