Mineração de dados educacionais com aprendizagem de máquina

Autores

DOI:

https://doi.org/10.15536/reducarmais.5.2021.2417

Palavras-chave:

Mineração de Dados Educacionais, Aprendizagem de Máquina, Previsão de Desempenho

Resumo

Com a o aumento da disponibilidade de dados, sobretudo no contexto educacional, surgiram áreas específicas para extração de informações relevantes, como a Mineração de Dados Educacionais (MDE), que integra inúmeras técnicas que dão suporte a captação, processamento e análises desses conjuntos de registros. A principal técnica associada a MDE é a Aprendizagem de Máquina, que vem sendo empregada a décadas no processamento de dados em diversos contextos, mas com o advento do Big Data houve uma intensificação na aplicação dessa técnica no intuito de extrair informações relevantes de uma enorme quantidade de dados. Nesse sentido, esse estudo tem como objetivo realizar a previsão do desempenho de alunos, em um conjunto de dados públicos, e comparar qual dos algoritmos de aprendizagem de máquina utilizados foi o mais eficaz, ademais indicar quais os principais atributos preditores para o desempenho dos alunos. Para isso foi implementado um processo de MDE baseado em 4 etapas: 1) Coleta de dados; 2) Extração de recursos e limpeza de dados (Pré-Processamento e Transformação); e 3) Processamento analítico e algoritmos; 4) análise e/ou interpretação dos resultados. Como resultado foi identificado que para o conjunto de dados utilizado neste estudo o algoritmo Árvores de Decisão foi o mais preciso – com uma acurácia de 87% – bem como foi constatado que atributos relacionados as atividades escolares são mais preditores para o desempenho dos alunos do que dados de características demográficas e socioeconômicas.

Biografia do Autor

Vanessa Faria de Souza, Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul

Doutoranda no PPGIE (Programa de Pós-Graduação em Informática na Educação) da Universidade Federal do Rio Grande do Sul (UFRGS). Mestre em Informática pelo PPGI (Programa de Pós-Graduação em Informática) da Universidade Tecnológica Federal do Paraná (UTFPR), na área de Computação Aplicada, e ênfase em Engenharia de Software. Possuo especialização em Educação Especial Inclusiva, com ênfase em Tecnologia Assistiva. Sou graduada em Sistemas de Informação pela Universidade Estadual do Norte do Paraná (2011). Completei a Licenciatura em Matemática, pela UTFPR. Atualmente sou docente dedicação exclusiva no Instituto Federal do Rio Grande do Sul, Campus Ibirubá, estou em afastamento para a realização do Doutorado. Ministro aulas nos Cursos de Ciência da Computação, Técnico em Informática Integrado do Ensino Médio, Licenciatura em Matemática e Especialização em Ensino de Linguagens e suas Tecnologias. Também já Atuei como Professora do Magistério Superior na Universidade Estadual do Norte do Paraná (UENP) nos cursos de Graduação Ciência da Computação e Sistemas de informação, nas disciplinas de Sistemas Digitais, Projeto e Análise de Algoritmo, Tópicos Avançados em Computação, Computação Simbólica e Numérica, Metodologia Científica. Assim como na UTFPR. Também já atuei como professora de Matemática no Ensino Básico.

Referências

AGGARWAL, Charu C. Data Mining: The Textbook. 1. ed. New York, USA: Springer, 2015. v. 1E-book. Disponível em: https://doi.org/10.1007/978-3-319-14142-8

BAKER, Michael J. The roles of models in Artificial Intelligence and Education research : a prospective view. Journal of Artificial Intelligence and Education, [S. l.], v. 11, p. 122–143, 2000.

BAKER, Ryan; ISOTANI, Seiji; CARVALHO, Adriana. Mineração de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informática na Educação, [S. l.], v. 19, n. 02, p. 3–13, 2011. Disponível em: https://doi.org/10.5753/rbie.2011.19.02.03

BISHOP, Christopher M.; PATTERN. Pattern Recognition and Machine Learning. 1. ed. Nova York, USA: Springer, 2006. E-book.

CHUI, Kwok Tai et al. Predicting at-risk university students in a virtual learning environment via a machine learning algorithm. Computers in Human Behavior, [S. l.], v. 107, n. December 2017, p. 105584, 2020. Disponível em: https://doi.org/10.1016/j.chb.2018.06.032

CORTEZ, P.; SILVA, A. Usando Data Mining para prever o desempenho dos alunos do ensino médio. In A. Brito e J. Teixeira Eds., Proceedings of 5th Future Business Technology Conference (FUBUTEC 2008). Porto, Portugal: EUROSIS, ISBN 978-9077381-39-7, 2008. p. 5-12.

DE LOS REYES, Daniel A. Guimarães et al. Predição de sucesso acadêmico de estudantes: uma análise sobre a demanda por uma abordagem baseada em transfer learning. Revista Brasileira de Informática na Educação, [S. l.], v. 27, n. 1, p. 1–25, 2019. Disponível em: https://doi.org/10.5753/rbie.2019.27.01.01

EDM. Educational Data Mining. [s. l.], 2020. Disponível em: http://educationaldatamining.org/. Acesso em: 31 maio. 2020.

HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. H. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. California, USA: Springer, 2009. E-book.

IGUAL, Laura; SEGUÍ, Santi. Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications. 1. ed. [S. l.]: Springer, 2017. E-book. Disponível em: https://doi.org/10.1007/978-3-319-50017-1

JAPKOWICZ, Nathalie; SHAH, Mohak. Evaluating Learning Algorithms: A Classification Perspective. 1a Ed. ed. Cambridge: [s. n.], 2014. E-book.

KUBAT, Miroslav. An Introduction to Machine Learning. 2. ed. Coral Gables, FL, USA: Springer, 2017. E-book. Disponível em: https://doi.org/10.1007/978-3-319-63913-0

LANDIS, J. Richard; KOCH, Gary G. This content downloaded from 185.2.32.58 on Tue. [S. l.], v. 33, n. 2, p. 363–374, 1977.

MITCHELL, Tom M. Machine Learning. 1. ed. Nova York, USA: McGraw-Hill Science/Engineering/Math, 1997. E-book.

RIGO, Sandro José et al. Minerando Dados Educacionais com foco na evasão escolar: oportunidades, desafios e necessidades. Revista Brasileira de Informática na Educação, [S. l.], v. 22, n. 01, p. 168–177, 2014. Disponível em: https://doi.org/10.5753/RBIE.2014.22.01.132

RODRIGUES, Rodrigo Lins et al.Discovery engagement patterns MOOCs through cluster analysis. IEEE Latin America Transactions, [S. l.], v. 14, n. 9, p. 4129–4135, 2016. Disponível em: https://doi.org/10.1109/TLA.2016.7785943

ROMERO, Cristobal; VENTURA, Sebastian. Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, [S. l.], v. 3, n. 1, p. 12–27, 2013. Disponível em: https://doi.org/10.1002/widm.1075

SAMUEL, A. L. Some studies in machine learning using the game of checkers. IBM Journal of Research and Development, [S. l.], v. 3, n. 3, p. 210–229, 1959. Disponível em: https://doi.org/10.1147/rd.33.0210

ZHANG, Yaling; WU, Bei. Research and application of grade prediction model based on decision tree algorithm. In: 2019, Chengdu, China. Turing Celebration Conference (ACM TURC 2019). Chengdu, China: ACM, 2019. p. 1–6. Disponível em: https://doi.org/10.1145/3321408.3322857

Downloads

Publicado

2021-07-03

Como Citar

Faria de Souza, V. (2021). Mineração de dados educacionais com aprendizagem de máquina. Revista Educar Mais, 5(4), 766-787. https://doi.org/10.15536/reducarmais.5.2021.2417

Edição

Seção

Artigos