AVALIAÇÃO DE DESEMPENHO ENTRE MODELOS NEURAIS CONVOLUCIONAIS PARA CLASSIFICAÇÃO DO OXFORD-IIIT PET DATASET

Héctor Dorrighello Giacon; Rodrigo Henrique  Cunha Palácios; Márcio   Mendonça; Mariana Gasparotto Palácios; André Roberto Ortoncelli

doi:10.29367/sbkzwh08

PDF

Publicado: mai 13, 2025

DOI: https://doi.org/10.29367/sbkzwh08

Palavras-chave:

Visão Computacional, Classificação, Convolução, Desempenho.

Héctor Dorrighello Giacon

Rodrigo Henrique Cunha Palácios

UTFPR-CP

Márcio Mendonça

Mariana Gasparotto Palácios

André Roberto Ortoncelli

Resumo

Este estudo investigou o desempenho de redes neurais convolucionais na classificação de imagens para categorizar uma base de dados em duas classes: gato e cachorro. Com diversas abordagens computacionais disponíveis para a comunidade, optou-se por treinar três modelos — MobileNet, ResNet e EfficientNet — utilizando essa base de imagens. Os modelos foram então submetidos a uma avaliação de desempenho final, comparando as probabilidades e os gradientes sobrepostos às imagens, a fim de determinar qual modelo se mostrou mais eficiente. Este artigo aborda conceitos de visão computacional e ilustra como diferentes modelos de redes neurais convolucionais processam os dados, oferecendo um guia para novos estudantes interessados na área de ciência de dados. Facilitando a compreensão dos principais objetivos e contribuições desta investigação cientifica. E se encerra com uma conclusão e endereça futuros trabalhos.

Edição

v. 20 n. 223 (2025): janeiro / abril

Seção

Artigos

Biografia do Autor

Rodrigo Henrique Cunha Palácios, UTFPR-CP

Possui doutorado em Engenharia Elétrica pela Universidade de São Paulo, mestrado em Engenharia Elétrica pela Universidade Estadual de Londrina, especialização em Engenharia de Software pelo Centro Universitário Filadélfia e graduação em Engenharia da Computação pela Universidade Norte do Paraná. Atualmente é professor lotado no Departamento de Computação da Universidade Tecnológica Federal do Paraná. Tem experiência na área computacional, atuando principalmente nas áreas de Reconhecimento de Padrões, Sistemas Inteligentes, Processamento de Sinais, Identificação de Falhas em Máquinas Elétricas, Robótica e Visão Computacional.

Referências

ALAM, M. U.; BALDVINSSON, J. R.; WANG, Y. Exploring LRP and Grad-CAM visualization to interpret multi-label-multi-class pathology prediction using chest radiography. In: IEEE International Symposium on Computer-Based Medical Systems, Shenzhen, China, p. 258-263, 2022.

DATA SCIENCE ACADEMY. Deep Learning Book. Disponível em: <https://www.deeplearningbook.com.br/>. Acesso em: 2024.

DUTT, V.; SASUBILLI, S. M.; YERRAPATI, A. E. Dynamic Information Retrieval with Chatbots: A Review of Artificial Intelligence Methodology. In: International Conference on Electronics, Communication and Aerospace Technology (ICECA), Coimbatore, India, p. 1299–1303, 2022.

GOLDBERG, D. E. Genetic Algorithms in Search, Optimization, and Machine Learning. Mass: Addison-Wesley, 1989.

HAYKIN, Simon. Neural Networks and Learning Machines. 3 ª. ed. Upper Saddle River, NJ: Prentice Hall, 2009.

HE, K., ZHANG, X., REN, S., SUN, J. Deep Residual Learning for Image Recognition, Microsoft Research, 2015.

HWU, Wen-mei W. GPU Computing Gems Jade Edition, Burlington, MA: Morgan Kaufmann, 1ª ed, 2011.

HOLLAND, J. H. Adaptation in Natural and Artificial Systems. Ann Arbor: University of Michigan Press, 1975.

MENDONÇA, M., KONDO, H. S., BOTONI de SOUZA, L., PALÁCIOS, R. H. C., SILVA de ALMEIDA, J. P. L. Semi-Unknown Environments Exploration Inspired by Swarm Robotics using Fuzzy Cognitive Maps, In: IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), New Orleans, LA, USA, pp. 1-8, 2019.

PARKHI, O. M., VEDALDI, A., ZISSERMAN, A., JAWAHAR, C. V. Cats and Dogs, em IEEE Conference on Computer Vision and Pattern Recognition, 2012.

PASSINO, M. K., YOURKOVICH, S. Fuzzy Control. Menlo Park: Addison-Wesley, 1997.

SANDLER, M.; HOWARD, A.; ZHU, M; ZHMOGINOV, A; CHEN, L-C. MobileNetV2: Inverted Residuals and Linear Bottlenecks. In: IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 4510-4520, 2018.

SELVARAJU, R. R., COGSWELL, M., Das, A., VEDANTAM, R., PARIKH, D., BATRA, D. Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization, International Journal of Computer Vision, 2019.

SICILIANO, B.; KHATIB, O. (EDS.). Springer Handbook of Robotics. 2. ed. Heidelberg: Springer-Verlag Berlin Heidelberg, 2016.

SILVA, I. R. R.; SOUZA, R. G.; SILVA, G. S. L.; OLIVEIRA, C. S.; CAVALCANTI, L. H.; BEZERRA, R. S., et al. Utilização de Redes Convolucionais Para Classificação e Diagnóstico da Doença de Alzheimer, In: II Simpósio de Inovação em Engenharia Biomédica, 2018.

TAN, M., Le, Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks, In: International Conference on Machine Learning, 2019.

YU, J.; CAO, J.; HE, R. Improving Subgraph Recognition with Variational Graph Information Bottleneck. In: IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), New Orleans, LA, USA, p. 19374-19383, 2022.

Barra lateral de artigos

Conteúdo do artigo principal

Resumo

Detalhes do artigo

Rodrigo Henrique Cunha Palácios, UTFPR-CP

Referências