Mineração de dados educacionais com algoritmos de regressão: um estudo sobre a predição do desempenho
DOI:
https://doi.org/10.15536/reducarmais.6.2022.2691Palavras-chave:
Mineração de Dados Educacionais, Aprendizagem de Máquina, Algoritmos de Regressão, Predição do DesempenhoResumo
Com a o aumento da disponibilidade de dados, sobretudo no contexto educacional, a Mineração de Dados Educacionais (MDE) tem se tornado cada vez mais importante para a tomada de decisão neste contexto. Um dos principais objetivos da MDE é a predição do desempenho, pois quando se sabe de forma antecipada sobre a performance dos alunos, é possível intervir evitando reprovações, e até mesmo a evasão. Nesse sentido, esse estudo tem como objetivo realizar a previsão do desempenho de alunos, em um conjunto de dados públicos, utilizando algoritmos de Regressão, ademais indicar quais os principais atributos preditores para o desempenho dos alunos. Para isso foi implementado um processo de MDE baseado em 4 etapas descritas por Aggarwal (2015). Como resultado foi identificado que para os dois conjuntos de dados analisados a Árvores de Decisão foi o mais preciso, com uma acurácia de 90% para a disciplina de Matemática, e o Random Forest teve o melhor desempenho para os dados referentes a disciplina de Português, 80% de precisão. Além disso, constatou-se que atributos relacionados as atividades escolares são mais preditores para o desempenho dos alunos, todavia alguns atributos decorrentes de características demográficas e socioeconômicas, também influenciam no desempenho.
Downloads
Referências
AGGARWAL, C. C. (2015). Data Mining: The Textbook. 1. ed. New York, USA: Springer. E-book. Disponível em:< https://doi.org/10.1007/978-3-319-14142-8>.
ALMASRI, A.; CELEBI, E.; ALKHAWALDEH, R.S. (2019). EMT: ensemble meta-based tree model for predicting student performance. Scientific Programming, v. 19, p. 1-14. Disponível em: <https://doi.org/10.1155/2019/3610248>.
BAKER, R.; ISOTANI, S.; CARVALHO, A. (2011). Mineração de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informática na Educação, v. 19, n. 2, p. 3–13. Disponível em: <https://doi.org/10.5753/rbie.2011.19.02.03>.
BAKER, R. S.; INVENTADO, P. S. (2014). Educational Data Mining and Learning Analytics. In: J.A. Larusson and B. White (EDS.) (org.). Learning Analytics: From Research to Practice. 1. ed. New York, USA: Springer, 1–195. E-book. Disponível em: <https://doi.org/10.1007/978-1-4614-3305-7>.
BAKER, R. S. J. D. (2015). Big data and education. 2. ed. New York, USA: A Massive Online Open Textbook (MOOT) - Teachers College, Columbia University. Disponível em: <http://www.columbia.edu/~rsb2162/bigdataeducation.html>.
CORTEZ, P.; SILVA, A. (2008). Using Data Mining to Predict Secondary School Student Performance. In A. Brito and J. Teixeira Eds., Proceedings of 5th FUture BUsiness TEChnology Conference (FUBUTEC 2008). Disponível em: <http://www3.dsi.uminho.pt/pcortez/student.pdf>.
DABHADE, P.; AGARWAL, R.; ALAMEEN, K. P.; FATHIMA, A. T.; SRIDHARAN, R.; GOPAKUMAR, G. (2021). Educational data mining for predicting students’ academic performance using machine learning algorithms. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.646>.
MALINI, J.; KALPANA, Y. (2021). Investigation of factors affecting student performance evaluation using education materials data mining technique. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.026>.
MDE. Sociedade Internacional de Mineração de Dados Educacionais. (2020). Disponível em: <http://educationaldatamining.org/>. Acesso em: 15 set. 2021.
JAPKOWICZ, N.; SHAH, M. (2014). Evaluating Learning Algorithms: A Classification Perspective. 1a Ed. ed. Cambridge, E-book. Disponível em: <https://dl.acm.org/doi/book/10.5555/1964882>.
KUBAT, M. (2017). An Introduction to Aprendizagem de Máquina. 2. ed. Coral Gables, FL, USA: Springer. E-book. Disponível em: <https://doi.org/10.1007/978-3-319-63913-0>.
RIESTRA-GONZÁLEZ, M.; PAULE-RUÍZ, M. DEL P.; ORTIN, F. (2021). Massive LMS log data analysis for the early prediction of course-agnostic student performance. Computers & Education, v. 163, p. 1-20. Disponível em: <https://doi.org/10.1016/j.compedu.2020.104108>.
ROMERO, C.; VENTURA, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 3, n. 1, p. 12–27. Disponível em: <https://doi.org/10.1002/widm.1075>.
ROMERO, C.; VENTURA, S. (2020). Educational data mining and learning analytics: An updated survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 10, n. 3, p. 1–21. Disponível em: <https://doi.org/10.1002/widm.1355>.
SHAHIRI, A. M.; HUSAIN, W.; RASHID, N. A. (2015). A Review on Predicting Student’s Performance Using Data Mining Techniques. Procedia Computer Science, v. 72, p. 414–422. Disponível em: <https://doi.org/10.1016/j.procs.2015.12.157>.
SINGH, R.; PAL, S. (2020). Machine learning algorithms and ensemble technique to improve prediction of students performance. International Journal of Advanced Trends in Computer Science and Engineering, v. 9, n. 3, p. 3970-3976. Disponível em: <https://doi.org/10.30534/ijatcse/2020/221932020>.
SOUZA, V. F.; PERRY, G. T. (2020). Tendências de Pesquisas em Mineração de Dados Educacionais em MOOCs: um Mapeamento Sistemático. Revista Brasileira de Informática na Educação, v. 28, p. 491-508. Disponível em: <http://dx.doi.org/10.5753/rbie.2020.28.0.491>.
TALAL, H.; SAEED, S. (2019) A study on adoption of data mining techniques to analyze academic performance. ICIC Express Letters, Part B: Applications, v. 10, n. 8, p. 681-687. Disponível em: <http://doi.org/10.24507/icicelb.10.08.681>.
YAACOB, W. F. W.; NASIR, S. A. M; YAACOB, W. F. W.; SOBRI, N. M. (2019). Supervised data mining approach for predicting student performance. Indonesian Journal of Electrical Engineering and Computer Science, v. 16, n. 3, p. 1584- 1592. Disponível em: <http://doi.org/10.11591/ijeecs.v16.i3.pp1584-1592>.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2022 Vanessa Faria de Souza, Sílvio Cézar Cazella
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
DECLARAÇÃO DE RESPONSABILIDADE: Certifico que participei da concepção do trabalho, em parte ou na íntegra, que não omiti quaisquer ligações ou acordos de financiamento entre os autores e companhias que possam ter interesse na publicação desse artigo. Certifico que o texto é original e que o trabalho, em parte ou na íntegra, ou qualquer outro trabalho com conteúdo substancialmente similar, de minha autoria, não foi enviado a outra revista e não o será enquanto sua publicação estiver sendo considerada pela Revista Educar Mais, quer seja no formato impresso ou no eletrônico.
O autor responsável pela submissão representa todos os autores do trabalho e, ao enviar o artigo para a revista, está garantindo que tem a permissão de todos para fazê-lo. Da mesma forma, assegura que o artigo não viola direitos autorais e que não há plágio no trabalho. A revista não se responsabiliza pelas opiniões emitidas.
A Revista Educar Mais é de acesso aberto (Open Access), sem que haja a necessidade de pagamentos de taxas, seja para submissão ou processamento dos artigos. A revista adota a definição da Budapest Open Access Initiative (BOAI), ou seja, os usuários possuem o direito de ler, baixar, copiar, distribuir, imprimir, buscar e fazer links diretos para os textos completos dos artigos nela publicados.
Todos os artigos são publicados com a licença Creative Commons Atribuição-NãoComercial 4.0 Internacional. Os autores mantém os direitos autorais sobre suas produções, devendo ser contatados diretamente se houver interesse em uso comercial dos trabalhos.