Mineração de dados educacionais com algoritmos de regressão: um estudo sobre a predição do desempenho

Autores

DOI:

https://doi.org/10.15536/reducarmais.6.2022.2691

Palavras-chave:

Mineração de Dados Educacionais, Aprendizagem de Máquina, Algoritmos de Regressão, Predição do Desempenho

Resumo

Com a o aumento da disponibilidade de dados, sobretudo no contexto educacional, a Mineração de Dados Educacionais (MDE) tem se tornado cada vez mais importante para a tomada de decisão neste contexto. Um dos principais objetivos da MDE é a predição do desempenho, pois quando se sabe de forma antecipada sobre a performance dos alunos, é possível intervir evitando reprovações, e até mesmo a evasão. Nesse sentido, esse estudo tem como objetivo realizar a previsão do desempenho de alunos, em um conjunto de dados públicos, utilizando algoritmos de Regressão, ademais indicar quais os principais atributos preditores para o desempenho dos alunos. Para isso foi implementado um processo de MDE baseado em 4 etapas descritas por Aggarwal (2015). Como resultado foi identificado que para os dois conjuntos de dados analisados a Árvores de Decisão foi o mais preciso, com uma acurácia de 90% para a disciplina de Matemática, e o Random Forest teve o melhor desempenho para os dados referentes a disciplina de Português, 80% de precisão. Além disso, constatou-se que atributos relacionados as atividades escolares são mais preditores para o desempenho dos alunos, todavia alguns atributos decorrentes de características demográficas e socioeconômicas, também influenciam no desempenho.

Downloads

Não há dados estatísticos.

Biografia do Autor

Vanessa Faria de Souza, Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul - IFRS

Doutoranda no PPGIE (Programa de Pós-Graduação em Informática na Educação) da Universidade Federal do Rio Grande do Sul (UFRGS). Mestre em Informática pelo PPGI (Programa de Pós-Graduação em Informática) da Universidade Tecnológica Federal do Paraná (UTFPR), na área de Computação Aplicada, e ênfase em Engenharia de Software. Possuo especialização em Educação Especial Inclusiva, com ênfase em Tecnologia Assistiva. Sou graduada em Sistemas de Informação pela Universidade Estadual do Norte do Paraná (2011). Completei a Licenciatura em Matemática, pela UTFPR. Atualmente sou docente dedicação exclusiva no Instituto Federal do Rio Grande do Sul, Campus Ibirubá, estou em afastamento para a realização do Doutorado. Ministro aulas nos Cursos de Ciência da Computação, Técnico em Informática Integrado do Ensino Médio, Licenciatura em Matemática e Especialização em Ensino de Linguagens e suas Tecnologias. Também já atuei como Professora do Magistério Superior na Universidade Estadual do Norte do Paraná (UENP) nos cursos de Graduação Ciência da Computação e Sistemas de informação, nas disciplinas de Sistemas Digitais, Projeto e Análise de Algoritmo, Tópicos Avançados em Computação, Computação Simbólica e Numérica, Metodologia Científica. Assim como na UTFPR. Também já atuei como professora de Matemática no Ensino Básico.

Sílvio Cézar Cazella, Universidade Federal de Ciências da Saúde de Porto Alegre - UFCSPA

Doutor em Ciência da Computação pela Universidade Federal do Rio Grande do Sul em 2006, tendo realizado doutorado "sanduiche" na Universidade de Alberta no Canadá. Mestre em Ciência da Computação pela Universidade Federal do Rio Grande do Sul em 1997. Graduado em Informática pela Pontifícia Universidade Católica do Rio Grande do Sul em 1993. Atualmente é Professor Associado - Nível II na Universidade Federal de Ciências da Saúde de Porto Alegre. Professor efetivo do Programa de Pós-Graduação em Ensino na Saúde (UFCSPA), Professor efetivo do Programa de Pós-Graduação em Tecnologias da Informação e Gestão em Saúde (UFCSPA) , colaborador do Programa de Pós-Graduação em Ciência da Saúde (UFCSPA) e colaborador do Programa de Pós-Graduação em Informática na Educação (UFRGS). Em seu currículo Lattes os termos mais frequentes na contextualização da produção científica, tecnológica e artístico-cultural são: Sistemas de Recomendação, Mineração de Dados, Engenharia de software, Sistemas Multiagentes, Data Mining, Inteligência Artificial, Sistemas Especialistas, Data Warehouse, Educação a Distância, Informática na Educação e Educação Permanente. Trabalha como Analista e Projetista (arquitetura) de Sistemas de Informação Estruturados e Orientados a Objetos, como Analista de Negócios, e como consultor em empresas na área de Tecnologia da Informação. Possui certificados do TOEFL, IELTS referente a língua inglesa e DELE referente a língua espanhola.

Referências

AGGARWAL, C. C. (2015). Data Mining: The Textbook. 1. ed. New York, USA: Springer. E-book. Disponível em:< https://doi.org/10.1007/978-3-319-14142-8>.

ALMASRI, A.; CELEBI, E.; ALKHAWALDEH, R.S. (2019). EMT: ensemble meta-based tree model for predicting student performance. Scientific Programming, v. 19, p. 1-14. Disponível em: <https://doi.org/10.1155/2019/3610248>.

BAKER, R.; ISOTANI, S.; CARVALHO, A. (2011). Mineração de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informática na Educação, v. 19, n. 2, p. 3–13. Disponível em: <https://doi.org/10.5753/rbie.2011.19.02.03>.

BAKER, R. S.; INVENTADO, P. S. (2014). Educational Data Mining and Learning Analytics. In: J.A. Larusson and B. White (EDS.) (org.). Learning Analytics: From Research to Practice. 1. ed. New York, USA: Springer, 1–195. E-book. Disponível em: <https://doi.org/10.1007/978-1-4614-3305-7>.

BAKER, R. S. J. D. (2015). Big data and education. 2. ed. New York, USA: A Massive Online Open Textbook (MOOT) - Teachers College, Columbia University. Disponível em: <http://www.columbia.edu/~rsb2162/bigdataeducation.html>.

CORTEZ, P.; SILVA, A. (2008). Using Data Mining to Predict Secondary School Student Performance. In A. Brito and J. Teixeira Eds., Proceedings of 5th FUture BUsiness TEChnology Conference (FUBUTEC 2008). Disponível em: <http://www3.dsi.uminho.pt/pcortez/student.pdf>.

DABHADE, P.; AGARWAL, R.; ALAMEEN, K. P.; FATHIMA, A. T.; SRIDHARAN, R.; GOPAKUMAR, G. (2021). Educational data mining for predicting students’ academic performance using machine learning algorithms. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.646>.

MALINI, J.; KALPANA, Y. (2021). Investigation of factors affecting student performance evaluation using education materials data mining technique. Materials Today: Proceedings. Disponível em: <https://doi.org/10.1016/j.matpr.2021.05.026>.

MDE. Sociedade Internacional de Mineração de Dados Educacionais. (2020). Disponível em: <http://educationaldatamining.org/>. Acesso em: 15 set. 2021.

JAPKOWICZ, N.; SHAH, M. (2014). Evaluating Learning Algorithms: A Classification Perspective. 1a Ed. ed. Cambridge, E-book. Disponível em: <https://dl.acm.org/doi/book/10.5555/1964882>.

KUBAT, M. (2017). An Introduction to Aprendizagem de Máquina. 2. ed. Coral Gables, FL, USA: Springer. E-book. Disponível em: <https://doi.org/10.1007/978-3-319-63913-0>.

RIESTRA-GONZÁLEZ, M.; PAULE-RUÍZ, M. DEL P.; ORTIN, F. (2021). Massive LMS log data analysis for the early prediction of course-agnostic student performance. Computers & Education, v. 163, p. 1-20. Disponível em: <https://doi.org/10.1016/j.compedu.2020.104108>.

ROMERO, C.; VENTURA, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 3, n. 1, p. 12–27. Disponível em: <https://doi.org/10.1002/widm.1075>.

ROMERO, C.; VENTURA, S. (2020). Educational data mining and learning analytics: An updated survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 10, n. 3, p. 1–21. Disponível em: <https://doi.org/10.1002/widm.1355>.

SHAHIRI, A. M.; HUSAIN, W.; RASHID, N. A. (2015). A Review on Predicting Student’s Performance Using Data Mining Techniques. Procedia Computer Science, v. 72, p. 414–422. Disponível em: <https://doi.org/10.1016/j.procs.2015.12.157>.

SINGH, R.; PAL, S. (2020). Machine learning algorithms and ensemble technique to improve prediction of students performance. International Journal of Advanced Trends in Computer Science and Engineering, v. 9, n. 3, p. 3970-3976. Disponível em: <https://doi.org/10.30534/ijatcse/2020/221932020>.

SOUZA, V. F.; PERRY, G. T. (2020). Tendências de Pesquisas em Mineração de Dados Educacionais em MOOCs: um Mapeamento Sistemático. Revista Brasileira de Informática na Educação, v. 28, p. 491-508. Disponível em: <http://dx.doi.org/10.5753/rbie.2020.28.0.491>.

TALAL, H.; SAEED, S. (2019) A study on adoption of data mining techniques to analyze academic performance. ICIC Express Letters, Part B: Applications, v. 10, n. 8, p. 681-687. Disponível em: <http://doi.org/10.24507/icicelb.10.08.681>.

YAACOB, W. F. W.; NASIR, S. A. M; YAACOB, W. F. W.; SOBRI, N. M. (2019). Supervised data mining approach for predicting student performance. Indonesian Journal of Electrical Engineering and Computer Science, v. 16, n. 3, p. 1584- 1592. Disponível em: <http://doi.org/10.11591/ijeecs.v16.i3.pp1584-1592>.

Downloads

Publicado

2022-02-18

Como Citar

Faria de Souza, V., & Cazella, S. C. (2022). Mineração de dados educacionais com algoritmos de regressão: um estudo sobre a predição do desempenho. Revista Educar Mais, 6, 183–198. https://doi.org/10.15536/reducarmais.6.2022.2691

Edição

Seção

Artigos