INTELIGÊNCIA ARTIFICIAL APLICADA À GESTÃO DO CONHECIMENTO: CONSTRUÇÃO DE CHATBOTS COM LLMS E RAG
Conteúdo do artigo principal
Resumo
Este artigo apresenta o desenvolvimento de um software de código aberto voltado à criação de chatbots de Perguntas e Respostas (QA) com base em modelos de linguagem de larga escala (LLMs) e no método de Recuperação Aumentada (RAG). A solução permite a ingestão de documentos em diversos formatos, a conversão dos conteúdos em vetores semânticos com modelos de embedding, e a recuperação de trechos relevantes a partir de consultas em linguagem natural. Utilizando a biblioteca LangChain, armazenamento vetorial com ChromaDB, interface com Streamlit e ajuste automatizado com Optuna, o sistema permite a personalização da cadeia de inferência e avaliação com base em um conjunto de perguntas e respostas esperadas. A aplicação foi testada em ambiente local e demonstrou resultados satisfatórios na geração de respostas técnicas fundamentadas. A arquitetura modular e extensível permite sua aplicação em contextos organizacionais diversos, com potencial para gestão do conhecimento, suporte técnico e automação de consultas documentais.
Detalhes do artigo
Referências
ARNOLD, P. G. et al. Performance of large language models for CAD-RADS 2.0 classification derived from cardiac CT reports. Journal of Cardiovascular Computed Tomography, 2025. ISSN 1934-5925. DOI: 10.1016/j.jcct.2025.03.007.
BIRHANE, A. et al. Science in the age of large language models. Nature Reviews Physics, v. 5, p. 277–280, 2023. DOI: 10.1038/s42254-023-00581-.
KOPP, T.; BAUMGARTNER, M.; KINKEL, S. Success factors for introducing industrial human-robot interaction in practice: an empirically driven framework.
International Journal of Advanced Manufacturing Technology, v. 112, p. 685–704, 2021. DOI: 10.1007/s00170-020-06398-0.
OTTER, D. W.; MEDINA, J. R.; KALITA, J. K. A survey of the usages of deep learning for natural language processing. IEEE Transactions on Neural Networks and Learning Systems, v. 32, n. 2, p. 604–624, fev. 2021. DOI: 10.1109/TNNLS.2020.2979670.
SALIM, M. S. et al. LLM based QA chatbot builder: a generative AI-based chatbot builder for question answering. SoftwareX, v. 29, 2025. Artigo 102029. DOI: 10.1016/j.softx.2024.102029.
STUREBORG, R.; ALIKANIOTIS, D.; SUHARA, Y. Large language models are inconsistent and biased evaluators. arXiv preprint, 2024. DOI: 10.48550/arXiv.2405.01724.
SU, P.-H. et al. Deep learning for conversational AI. In: Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Tutorial Abstracts. New Orleans: ACL, 2018. p. 27–32. DOI: 10.18653/v1/N18-6006.
SUTSKEVER, I.; VINYALS, O.; LE, Q. V. Sequence to sequence learning with neural networks. In: Proceedings of the 27th International Conference on Neural Information Processing Systems – Volume 2 (NIPS'14). MIT Press, 2014. p. 3104–3112.
VASWANI, A. et al. Attention is all you need. Advances in Neural Information Processing Systems, v. 30, 2017.
VINYALS, O.; LE, Q. A neural conversational model. arXiv preprint, 2015. DOI: 10.48550/arXiv.1506.05869.
WALLACE, R. S. The Anatomy of A.L.I.C.E. In: Parsing the Turing Test: Philosophical and Methodological Issues in the Quest for the Thinking Computer. Dordrecht: Springer, 2007. p. 181–210. DOI: 10.1007/978-1-4020-6710-5_13.
WEIZENBAUM, J. ELIZA—a computer program for the study of natural language communication between man and machine. Communications of the ACM, v. 9, n. 1, p. 36–45, jan. 1966. DOI: 10.1145/365153.365168.
YIN, J. et al. Neural generative question answering. In: Workshop on Human-Computer Question Answering. Association for Computational Linguistics (ACL), 2016. p. 36–42. DOI: 10.18653/v1/W16-0106.