Usando um Algoritmo Genético para diminuir a dimensão de um problema de classificação
DOI:
https://doi.org/10.5540/03.2023.010.01.0115Palabras clave:
Algoritmo Genético, KNN, Otimização, ClassificaçãoResumen
Existem diversos tipos de algoritmos de otimização bem como algoritmos de classifi- cação. Dentre tais algoritmos, o algoritmo genético elitista é um representante dos algoritmos de otimização, enquanto o KNN é um representante dos algoritmos de classificação. O objetivo desse trabalho é mostrar, através de uma aplicação, como podemos usar essas duas classes de algoritmos em conjunto para não apenas otimizar o número de acertos de classificação, mas também para reduzir a dimensão do problema. A situação utilizada é a classificação de cooperativas brasileiras usando o texto de seus estatutos. O banco de palavras utilizado constava de 8293 palavras que ao longo do processo foi reduzido para 1037 palavras e o número de sucessos de classificação foi maior que 81%.
Descargas
Citas
E. Acosta-González e F. Fernández-Rodríguez. “Model selection via genetic algorithms illustrated with cross-country growth data”. Em: Empirical Economics 33 (2007), pp. 313–337. doi: 10.1007/s00181-006-0104-3.
V.S.M. Campos, A.G.C. Pereira e J.A. Rojas Cruz. “Modeling the Genetic Algorithm by a Non-Homogeneous Markov Chain: Weak and Strong Ergodicity”. Em: Theory of Probability and its Applications 57 (2012), pp. 185–192. doi: 10.4213/tvp4440.
J.H. Holland. Adaptation in natural and artificial systems. Ann Arbor: The University of Michigan Press, 1975.
G. James et al. An introduction to statistical learning with R applications. Springer, 2014.
A. Kasambara. Machine Learning Essentials : Practical Guide in R. Published by STHDA, 2017, 2017.
E. G. Lacerda, A. C. Carvalho e T. B. Ludermir. “Model selection via genetic algorithms for rbf networks”. Em: Journal of Intelligent & Fuzzy Systems, IOS Press 13 (2002), pp. 111–122.
B. Lantz. Machine Learning with R : Expert techniques for predictive modeling. Packt, Birmingham, 2019.
S. Paterlini e T. Minerva. “Regression model selection using genetic algorithms”. Em: Proceedings of the 11th WSEAS international conference on nural networks and 11th WSEAS international conference on evolutionary computing and 11th WSEAS international conference on Fuzzy systems. World Scientific and Engineering Academy and Society (WSEAS). 2010, pp. 19–27.
A. G. C. Pereira e B.B. Andrade. “On the Genetic Algorithm with Adaptive Mutation Rate and Selected Statistical Applications”. Em: Computational Statistics (Zeitschrift) 30 (2015), pp. 131–150. doi: 10.1007/s00180-014-0526-x.
A. G. C. Pereira et al. “Convergence Analysis of an Elitist non-Homogeneous Genetic Algorithm with Crossover/Mutation Probabilities Adjusted by a Fuzzy Controller”. Em: Chilean Journal of Statistics 9 (2018), pp. 19–32.
A. G. C. Pereira et al. “On the convergence rate of the elitist genetic algorithm based on mutation probability.” Em: Communications in Statistics - Theory and Methods 49 (2019), pp. 769–780. doi: 10.1080/03610926.2018.1528361.
G. Rudolph. “Convergence Analysis of Canonical Genetic Algorithms”. Em: IEEE Transactions on Neural Networks 5 (1994), pp. 96–101. doi: 10.1109/72.265964.