Este projeto implementa uma solução RAG (Retrieval Augmented Generation) com as seguintes funcionalidades principais:
- Processamento de arquivos PDF
- Armazenamento em base vetorial
- Endpoint para realização de perguntas
- Persistência das perguntas com suas respectivas respostas
- Langchain
- FastAPI
- Base vetorial (Chroma ou Pinecone)
- LLM Gemini 2 Flash (gratuito)
- Ambiente com Docker e Docker Compose
- Banco NoSQL para armazenamento de perguntas e respostas
- Clone o repositório:
git clone https://github.com/yanagassi/RAG_PDF.git
cd RAG_PDF- Crie um arquivo
.envbaseado no arquivo.env.examplee configure a chave de API do Google:
GOOGLE_API_KEY=sua-chave-googleImportante: Não esqueça de habilitar o serviço Generative Language para a sua chave na Google Cloud.
- Suba os containers usando Docker Compose:
docker-compose up --build- Acesse a documentação da API em: http://localhost:8000/docs
Adicionei também uma collection do Postman além do Swagger para facilitar os testes.