AVALIAÇÃO DE DESEMPENHO ENTRE MODELOS NEURAIS CONVOLUCIONAIS PARA CLASSIFICAÇÃO DO OXFORD-IIIT PET DATASET
Conteúdo do artigo principal
Resumo
Este estudo investigou o desempenho de redes neurais convolucionais na classificação de imagens para categorizar uma base de dados em duas classes: gato e cachorro. Com diversas abordagens computacionais disponíveis para a comunidade, optou-se por treinar três modelos — MobileNet, ResNet e EfficientNet — utilizando essa base de imagens. Os modelos foram então submetidos a uma avaliação de desempenho final, comparando as probabilidades e os gradientes sobrepostos às imagens, a fim de determinar qual modelo se mostrou mais eficiente. Este artigo aborda conceitos de visão computacional e ilustra como diferentes modelos de redes neurais convolucionais processam os dados, oferecendo um guia para novos estudantes interessados na área de ciência de dados. Facilitando a compreensão dos principais objetivos e contribuições desta investigação cientifica. E se encerra com uma conclusão e endereça futuros trabalhos.
Detalhes do artigo
Referências
ALAM, M. U.; BALDVINSSON, J. R.; WANG, Y. Exploring LRP and Grad-CAM visualization to interpret multi-label-multi-class pathology prediction using chest radiography. In: IEEE International Symposium on Computer-Based Medical Systems, Shenzhen, China, p. 258-263, 2022.
DATA SCIENCE ACADEMY. Deep Learning Book. Disponível em: <https://www.deeplearningbook.com.br/>. Acesso em: 2024.
DUTT, V.; SASUBILLI, S. M.; YERRAPATI, A. E. Dynamic Information Retrieval with Chatbots: A Review of Artificial Intelligence Methodology. In: International Conference on Electronics, Communication and Aerospace Technology (ICECA), Coimbatore, India, p. 1299–1303, 2022.
GOLDBERG, D. E. Genetic Algorithms in Search, Optimization, and Machine Learning. Mass: Addison-Wesley, 1989.
HAYKIN, Simon. Neural Networks and Learning Machines. 3 ª. ed. Upper Saddle River, NJ: Prentice Hall, 2009.
HE, K., ZHANG, X., REN, S., SUN, J. Deep Residual Learning for Image Recognition, Microsoft Research, 2015.
HWU, Wen-mei W. GPU Computing Gems Jade Edition, Burlington, MA: Morgan Kaufmann, 1ª ed, 2011.
HOLLAND, J. H. Adaptation in Natural and Artificial Systems. Ann Arbor: University of Michigan Press, 1975.
MENDONÇA, M., KONDO, H. S., BOTONI de SOUZA, L., PALÁCIOS, R. H. C., SILVA de ALMEIDA, J. P. L. Semi-Unknown Environments Exploration Inspired by Swarm Robotics using Fuzzy Cognitive Maps, In: IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), New Orleans, LA, USA, pp. 1-8, 2019.
PARKHI, O. M., VEDALDI, A., ZISSERMAN, A., JAWAHAR, C. V. Cats and Dogs, em IEEE Conference on Computer Vision and Pattern Recognition, 2012.
PASSINO, M. K., YOURKOVICH, S. Fuzzy Control. Menlo Park: Addison-Wesley, 1997.
SANDLER, M.; HOWARD, A.; ZHU, M; ZHMOGINOV, A; CHEN, L-C. MobileNetV2: Inverted Residuals and Linear Bottlenecks. In: IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 4510-4520, 2018.
SELVARAJU, R. R., COGSWELL, M., Das, A., VEDANTAM, R., PARIKH, D., BATRA, D. Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization, International Journal of Computer Vision, 2019.
SICILIANO, B.; KHATIB, O. (EDS.). Springer Handbook of Robotics. 2. ed. Heidelberg: Springer-Verlag Berlin Heidelberg, 2016.
SILVA, I. R. R.; SOUZA, R. G.; SILVA, G. S. L.; OLIVEIRA, C. S.; CAVALCANTI, L. H.; BEZERRA, R. S., et al. Utilização de Redes Convolucionais Para Classificação e Diagnóstico da Doença de Alzheimer, In: II Simpósio de Inovação em Engenharia Biomédica, 2018.
TAN, M., Le, Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks, In: International Conference on Machine Learning, 2019.
YU, J.; CAO, J.; HE, R. Improving Subgraph Recognition with Variational Graph Information Bottleneck. In: IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), New Orleans, LA, USA, p. 19374-19383, 2022.