AVALIAÇÃO DE DESEMPENHO ENTRE MODELOS NEURAIS CONVOLUCIONAIS PARA CLASSIFICAÇÃO DO OXFORD-IIIT PET DATASET

Conteúdo do artigo principal

Héctor Dorrighello Giacon
Rodrigo Henrique Cunha Palácios
Márcio Mendonça
Mariana Gasparotto Palácios
André Roberto Ortoncelli

Resumo

Este estudo investigou o desempenho de redes neurais convolucionais na classificação de imagens para categorizar uma base de dados em duas classes: gato e cachorro. Com diversas abordagens computacionais disponíveis para a comunidade, optou-se por treinar três modelos — MobileNet, ResNet e EfficientNet — utilizando essa base de imagens. Os modelos foram então submetidos a uma avaliação de desempenho final, comparando as probabilidades e os gradientes sobrepostos às imagens, a fim de determinar qual modelo se mostrou mais eficiente. Este artigo aborda conceitos de visão computacional e ilustra como diferentes modelos de redes neurais convolucionais processam os dados, oferecendo um guia para novos estudantes interessados na área de ciência de dados. Facilitando a compreensão dos principais objetivos e contribuições desta investigação cientifica. E se encerra com uma conclusão e endereça futuros trabalhos.

Detalhes do artigo

Seção
Artigos
Biografia do Autor

Rodrigo Henrique Cunha Palácios, UTFPR-CP

Possui doutorado em Engenharia Elétrica pela Universidade de São Paulo, mestrado em Engenharia Elétrica pela Universidade Estadual de Londrina, especialização em Engenharia de Software pelo Centro Universitário Filadélfia e graduação em Engenharia da Computação pela Universidade Norte do Paraná. Atualmente é professor lotado no Departamento de Computação da Universidade Tecnológica Federal do Paraná. Tem experiência na área computacional, atuando principalmente nas áreas de Reconhecimento de Padrões, Sistemas Inteligentes, Processamento de Sinais, Identificação de Falhas em Máquinas Elétricas, Robótica e Visão Computacional.

Referências

ALAM, M. U.; BALDVINSSON, J. R.; WANG, Y. Exploring LRP and Grad-CAM visualization to interpret multi-label-multi-class pathology prediction using chest radiography. In: IEEE International Symposium on Computer-Based Medical Systems, Shenzhen, China, p. 258-263, 2022.

DATA SCIENCE ACADEMY. Deep Learning Book. Disponível em: <https://www.deeplearningbook.com.br/>. Acesso em: 2024.

DUTT, V.; SASUBILLI, S. M.; YERRAPATI, A. E. Dynamic Information Retrieval with Chatbots: A Review of Artificial Intelligence Methodology. In: International Conference on Electronics, Communication and Aerospace Technology (ICECA), Coimbatore, India, p. 1299–1303, 2022.

GOLDBERG, D. E. Genetic Algorithms in Search, Optimization, and Machine Learning. Mass: Addison-Wesley, 1989.

HAYKIN, Simon. Neural Networks and Learning Machines. 3 ª. ed. Upper Saddle River, NJ: Prentice Hall, 2009.

HE, K., ZHANG, X., REN, S., SUN, J. Deep Residual Learning for Image Recognition, Microsoft Research, 2015.

HWU, Wen-mei W. GPU Computing Gems Jade Edition, Burlington, MA: Morgan Kaufmann, 1ª ed, 2011.

HOLLAND, J. H. Adaptation in Natural and Artificial Systems. Ann Arbor: University of Michigan Press, 1975.

MENDONÇA, M., KONDO, H. S., BOTONI de SOUZA, L., PALÁCIOS, R. H. C., SILVA de ALMEIDA, J. P. L. Semi-Unknown Environments Exploration Inspired by Swarm Robotics using Fuzzy Cognitive Maps, In: IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), New Orleans, LA, USA, pp. 1-8, 2019.

PARKHI, O. M., VEDALDI, A., ZISSERMAN, A., JAWAHAR, C. V. Cats and Dogs, em IEEE Conference on Computer Vision and Pattern Recognition, 2012.

PASSINO, M. K., YOURKOVICH, S. Fuzzy Control. Menlo Park: Addison-Wesley, 1997.

SANDLER, M.; HOWARD, A.; ZHU, M; ZHMOGINOV, A; CHEN, L-C. MobileNetV2: Inverted Residuals and Linear Bottlenecks. In: IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 4510-4520, 2018.

SELVARAJU, R. R., COGSWELL, M., Das, A., VEDANTAM, R., PARIKH, D., BATRA, D. Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization, International Journal of Computer Vision, 2019.

SICILIANO, B.; KHATIB, O. (EDS.). Springer Handbook of Robotics. 2. ed. Heidelberg: Springer-Verlag Berlin Heidelberg, 2016.

SILVA, I. R. R.; SOUZA, R. G.; SILVA, G. S. L.; OLIVEIRA, C. S.; CAVALCANTI, L. H.; BEZERRA, R. S., et al. Utilização de Redes Convolucionais Para Classificação e Diagnóstico da Doença de Alzheimer, In: II Simpósio de Inovação em Engenharia Biomédica, 2018.

TAN, M., Le, Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks, In: International Conference on Machine Learning, 2019.

YU, J.; CAO, J.; HE, R. Improving Subgraph Recognition with Variational Graph Information Bottleneck. In: IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), New Orleans, LA, USA, p. 19374-19383, 2022.