Método de clusterização híbrida baseado em lógica fuzzy para espécies de Kinetoplastea usando sequências não alinhadas

Autores/as

  • Antonio R. A. Pereira Universidade Federal do Rio de Janeiro
  • Flávio L. de Melo Universidade Federal do Rio de Janeiro
  • Marcello G. Teixeira Universidade Federal do Rio de Janeiro
  • Maria A. Dario Fundação Oswaldo Cruz
  • Márcio G. Pavan Fundação Oswaldo Cruz
  • Ana M. Jansen Fundação Oswaldo Cruz
  • Samanta C. C. Xavier Fundação Oswaldo Cruz

DOI:

https://doi.org/10.5540/03.2026.012.01.0317

Palabras clave:

Aprendizado de Máquina, Lógica Fuzzy, Clusterização, Taxonomia, Sequências não Alinhadas

Resumen

Este artigo propõe uma metodologia híbrida de clusterização, combinando algoritmos fuzzy c-means e hierárquico, para análise taxonômica de espécies da classe Kinetoplastea, utilizando sequências de DNA não alinhadas. O pré-processamento envolveu cálculo de distâncias baseado em k-mers, gerando uma matriz de distâncias. Os resultados identificaram cinco grupos geneticamente distintos, validados pelos métodos de correlação cophenética, coeficiente de partição fuzzy e inércia, refletindo relações evolutivas e distinções entre parasitas e espécies de vida livre. O método apresentou resultados promissores, oferecendo uma alternativa para estudos taxonômicos em biologia computacional.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

L. E. Aik, T. W. Choon e M. S. Abu. “K-means algorithm based on flower pollination algorithm and calinski-harabasz index”. Em: Journal of Physics: Conference Series. Vol. 2643. 1. IOP Publishing. 2023, pp. 012019–012026.

J. Azé, C. Sola, J. Zhang, F. L. Marin, M. Yasmin, R. Siddiqui, K. Kremer, D. Van Soolingen e G. Refrégier. “Genomics and machine learning for taxonomy consensus: the Mycobacterium tuberculosis complex paradigm”. Em: PloS one 10.7 (2015), e0130912.

J. C. Bezdek. Pattern recognition with fuzzy objective function algorithms. Springer Science & Business Media, 2013.

V. H. Borba, C. Martin, J. R. M. Silva, Sa. C. C. Xavier, F. L. de Mello e A. M. Iñiguez. “Machine learning approach to support taxonomic species discrimination based on helminth collections data”. Em: Parasites and Vectors 14 (2021). issn: 1756-3305. doi: 10.1186/s13071-021-04721-6.

S. Derkarabetian, S. Castillo, P. K Koo, S. Ovchinnikov e M. Hedin. “A demonstration of unsupervised machine learning in species delimitation”. Em: Molecular phylogenetics and evolution 139 (2019), p. 106562.

G. A. Garcia, A. R. Lord, L. M. B. Santos, T. N. Kariyawasam, M. R. David, D. C. Lima, A. T. Ferreira, M. G. Pavan, M. T. Sikulu-Lord e R. M. Freitas. “Rapid and Non-Invasive Detection of Aedes aegypti Co-Infected with Zika and Dengue Viruses Using Near Infrared Spectroscopy”. Em: Viruses 15.1 (2022), pp. 11–24.

D.H. Le. “Machine learning-based approaches for disease gene prediction”. Em: Briefings in Functional Genomics 19.5-6 (2020), pp. 350–363. issn: 2041-2657. doi: 10.1093/bfgp/elaa013.

D. M. Lopez, F. L. de Mello, C. M. Giordano Dias, P. Almeida, M. Araújo, M. A. Magalhães, G. S. Gazeta e R. P. Brasil. “Evaluating the Surveillance System for Spotted Fever in Brazil Using Machine-Learning Techniques”. Em: Frontiers in Public Health 5 (2017), pp. 323–332. issn: 2296-2565. doi: 10.3389/fpubh.2017.00323.

C. Martin, N. N. Diaz, J. Ontrup e T. W. Nattkemper. “Hyperbolic SOM-based clustering of DNA fragment features for taxonomic visualization and classification”. Em: Bioinformatics 24.14 (2008), pp. 1568–1574.

M. C. Monard e J. A. Baranauskas. “Conceitos sobre aprendizado de máquina”. Em: Sistemas inteligentes-Fundamentos e aplicações 1.1 (2003), pp. 89–114.

F. Murtagh e P. Contreras. “Algorithms for hierarchical clustering: an overview”. Em: Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 2.1 (2012), pp. 86–97.

L. S. Ochi, C. R. Dias e S. S. F. Soares. “Clusterização em mineração de dados”. Em: Instituto de Computação-Universidade Federal Fluminense-Niterói 1 (2004), p. 46.

R. Resmini, A. Conci, T. B. Borchartt, R. C. F. de Lima, A. A. Montenegro e C. A. Pantaleão. “Diagnóstico precoce de doenças mamárias usando imagens térmicas e aprendizado de máquina”. Em: Revista brasileira de Contabilidade e Gestão 1.1 (2012), pp. 55–67.

R. R. Sokal e F. J. Rohlf. “The comparison of dendrograms by objective methods”. Em: Taxon (1962), pp. 33–40.

A. Zielezinski, S. Vinga, J. Almeida e W. M. Karlowski. “Alignment-free sequence comparison: benefits, applications, and tools”. Em: Genome biology 18 (2017), pp. 1–17.

Publicado

2026-02-13

Número

Sección

Trabalhos Completos