Identificação e classificação de dígitos manuscritos com auxílio de PCA

Authors

  • Lucas A. A. Ramos Ponte Instituto Tecnológico de Aeronáutica (ITA)
  • Régis M. A. da Costa Instituto Tecnológico de Aeronáutica (ITA)

Keywords:

PCA, reconhecimento de dígitos manuscritos, redução de dimensionalidade, aprendizado de máquina

Abstract

O reconhecimento de dígitos manuscritos é um desafio crucial na visão computacional, com aplicações importantes em serviços postais e processamento de documentos. Este relatório propõe uma abordagem usando Análise de Componentes Principais (PCA) para extrair características essenciais das imagens de dígitos, visando aprimorar a eficiência e precisão dos modelos de aprendizado de máquina. O conjunto de dados analisado inclui 5620 imagens de dígitos manuscritos, cada uma em 8×8 pixels em tons de cinza, utilizadas para avaliar algoritmos de reconhecimento. As imagens foram linearizadas para facilitar o processamento dos dados e a aplicação de técnicas analíticas. O PCA é então aplicado para identificar componentes principais descorrelacionadas, ordenadas por sua contribuição para a variância total, reduzindo a dimensionalidade e preservando a informação das características. Portanto, com a redução da quantidade de dados, preservando a informação, auxilia no desempenho de modelos de aprendizado de máquina.

Downloads

Download data is not yet available.

References

I. T. Jolliffe. Principal component analysis for special types of data. Springer, 2002.

S. K. Joshi e S. Machchhar. “An evolution and evaluation of dimensionality reduction techniques—A comparative study”. Em: 2014 IEEE International Conference on Computational Intelligence and Computing Research. IEEE. 2014, pp. 1–5.

J. VanderPlas. Python data science handbook: Essential tools for working with data. O’Reilly Media, Inc., 2016.

Published

2025-01-20