Desarrollé una solución de chatbot empresarial que implementa Retrieval-Augmented Generation (RAG) para proporcionar respuestas precisas basadas en documentos específicos. El proyecto surgió de la necesidad de crear una herramienta que pudiera procesar y consultar grandes volúmenes de información de la organización de manera eficiente, optimizando costos operacionales
Este proyecto utiliza los servicios de Azure, debido a las politicas de gobernanza de datos que ofrecen. El sistema utiliza embeddings vectoriales para indexar documentos y Azure AI Search como base de datos vectorial, permitiendo búsquedas híbridas rápidas y precisas. La integración con la API de OpenAI garantiza respuestas coherentes y contextualmente relevantes. La solución está diseñada para manejar un alto volumen de peticiones y soportar cargas elevadas. Para lograrlo, se utiliza Python junto con el framework Quart, lo que permite procesar las solicitudes de manera asíncrona y eficiente.