Mineração de dados educacionais com aprendizagem de máquina
DOI:
https://doi.org/10.15536/reducarmais.5.2021.2417Palavras-chave:
Mineração de Dados Educacionais, Aprendizagem de Máquina, Previsão de DesempenhoResumo
Com a o aumento da disponibilidade de dados, sobretudo no contexto educacional, surgiram áreas específicas para extração de informações relevantes, como a Mineração de Dados Educacionais (MDE), que integra inúmeras técnicas que dão suporte a captação, processamento e análises desses conjuntos de registros. A principal técnica associada a MDE é a Aprendizagem de Máquina, que vem sendo empregada a décadas no processamento de dados em diversos contextos, mas com o advento do Big Data houve uma intensificação na aplicação dessa técnica no intuito de extrair informações relevantes de uma enorme quantidade de dados. Nesse sentido, esse estudo tem como objetivo realizar a previsão do desempenho de alunos, em um conjunto de dados públicos, e comparar qual dos algoritmos de aprendizagem de máquina utilizados foi o mais eficaz, ademais indicar quais os principais atributos preditores para o desempenho dos alunos. Para isso foi implementado um processo de MDE baseado em 4 etapas: 1) Coleta de dados; 2) Extração de recursos e limpeza de dados (Pré-Processamento e Transformação); e 3) Processamento analítico e algoritmos; 4) análise e/ou interpretação dos resultados. Como resultado foi identificado que para o conjunto de dados utilizado neste estudo o algoritmo Árvores de Decisão foi o mais preciso – com uma acurácia de 87% – bem como foi constatado que atributos relacionados as atividades escolares são mais preditores para o desempenho dos alunos do que dados de características demográficas e socioeconômicas.
Downloads
Referências
AGGARWAL, Charu C. Data Mining: The Textbook. 1. ed. New York, USA: Springer, 2015. v. 1E-book. Disponível em: https://doi.org/10.1007/978-3-319-14142-8
BAKER, Michael J. The roles of models in Artificial Intelligence and Education research : a prospective view. Journal of Artificial Intelligence and Education, [S. l.], v. 11, p. 122–143, 2000.
BAKER, Ryan; ISOTANI, Seiji; CARVALHO, Adriana. Mineração de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informática na Educação, [S. l.], v. 19, n. 02, p. 3–13, 2011. Disponível em: https://doi.org/10.5753/rbie.2011.19.02.03
BISHOP, Christopher M.; PATTERN. Pattern Recognition and Machine Learning. 1. ed. Nova York, USA: Springer, 2006. E-book.
CHUI, Kwok Tai et al. Predicting at-risk university students in a virtual learning environment via a machine learning algorithm. Computers in Human Behavior, [S. l.], v. 107, n. December 2017, p. 105584, 2020. Disponível em: https://doi.org/10.1016/j.chb.2018.06.032
CORTEZ, P.; SILVA, A. Usando Data Mining para prever o desempenho dos alunos do ensino médio. In A. Brito e J. Teixeira Eds., Proceedings of 5th Future Business Technology Conference (FUBUTEC 2008). Porto, Portugal: EUROSIS, ISBN 978-9077381-39-7, 2008. p. 5-12.
DE LOS REYES, Daniel A. Guimarães et al. Predição de sucesso acadêmico de estudantes: uma análise sobre a demanda por uma abordagem baseada em transfer learning. Revista Brasileira de Informática na Educação, [S. l.], v. 27, n. 1, p. 1–25, 2019. Disponível em: https://doi.org/10.5753/rbie.2019.27.01.01
EDM. Educational Data Mining. [s. l.], 2020. Disponível em: http://educationaldatamining.org/. Acesso em: 31 maio. 2020.
HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. H. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. California, USA: Springer, 2009. E-book.
IGUAL, Laura; SEGUÍ, Santi. Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications. 1. ed. [S. l.]: Springer, 2017. E-book. Disponível em: https://doi.org/10.1007/978-3-319-50017-1
JAPKOWICZ, Nathalie; SHAH, Mohak. Evaluating Learning Algorithms: A Classification Perspective. 1a Ed. ed. Cambridge: [s. n.], 2014. E-book.
KUBAT, Miroslav. An Introduction to Machine Learning. 2. ed. Coral Gables, FL, USA: Springer, 2017. E-book. Disponível em: https://doi.org/10.1007/978-3-319-63913-0
LANDIS, J. Richard; KOCH, Gary G. This content downloaded from 185.2.32.58 on Tue. [S. l.], v. 33, n. 2, p. 363–374, 1977.
MITCHELL, Tom M. Machine Learning. 1. ed. Nova York, USA: McGraw-Hill Science/Engineering/Math, 1997. E-book.
RIGO, Sandro José et al. Minerando Dados Educacionais com foco na evasão escolar: oportunidades, desafios e necessidades. Revista Brasileira de Informática na Educação, [S. l.], v. 22, n. 01, p. 168–177, 2014. Disponível em: https://doi.org/10.5753/RBIE.2014.22.01.132
RODRIGUES, Rodrigo Lins et al.Discovery engagement patterns MOOCs through cluster analysis. IEEE Latin America Transactions, [S. l.], v. 14, n. 9, p. 4129–4135, 2016. Disponível em: https://doi.org/10.1109/TLA.2016.7785943
ROMERO, Cristobal; VENTURA, Sebastian. Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, [S. l.], v. 3, n. 1, p. 12–27, 2013. Disponível em: https://doi.org/10.1002/widm.1075
SAMUEL, A. L. Some studies in machine learning using the game of checkers. IBM Journal of Research and Development, [S. l.], v. 3, n. 3, p. 210–229, 1959. Disponível em: https://doi.org/10.1147/rd.33.0210
ZHANG, Yaling; WU, Bei. Research and application of grade prediction model based on decision tree algorithm. In: 2019, Chengdu, China. Turing Celebration Conference (ACM TURC 2019). Chengdu, China: ACM, 2019. p. 1–6. Disponível em: https://doi.org/10.1145/3321408.3322857
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2021 Vanessa Faria de Souza
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
DECLARAÇÃO DE RESPONSABILIDADE: Certifico que participei da concepção do trabalho, em parte ou na íntegra, que não omiti quaisquer ligações ou acordos de financiamento entre os autores e companhias que possam ter interesse na publicação desse artigo. Certifico que o texto é original e que o trabalho, em parte ou na íntegra, ou qualquer outro trabalho com conteúdo substancialmente similar, de minha autoria, não foi enviado a outra revista e não o será enquanto sua publicação estiver sendo considerada pela Revista Educar Mais, quer seja no formato impresso ou no eletrônico.
O autor responsável pela submissão representa todos os autores do trabalho e, ao enviar o artigo para a revista, está garantindo que tem a permissão de todos para fazê-lo. Da mesma forma, assegura que o artigo não viola direitos autorais e que não há plágio no trabalho. A revista não se responsabiliza pelas opiniões emitidas.
A Revista Educar Mais é de acesso aberto (Open Access), sem que haja a necessidade de pagamentos de taxas, seja para submissão ou processamento dos artigos. A revista adota a definição da Budapest Open Access Initiative (BOAI), ou seja, os usuários possuem o direito de ler, baixar, copiar, distribuir, imprimir, buscar e fazer links diretos para os textos completos dos artigos nela publicados.
Todos os artigos são publicados com a licença Creative Commons Atribuição-NãoComercial 4.0 Internacional. Os autores mantém os direitos autorais sobre suas produções, devendo ser contatados diretamente se houver interesse em uso comercial dos trabalhos.