Gianna - Assistente de Voz Inteligente

Gianna é um framework avançado de assistente de voz construído com Python, integrando múltiplos provedores LLM, processamento de áudio em tempo real, sistema multi-agente e memória semântica inteligente.

✨ Principais Características

🧠 Sistema Multi-Agente Inteligente

5 Fases de Implementação progressivas e modulares
Agentes ReAct especializados para diferentes domínios
Orquestração inteligente com execução paralela e sequencial
Coordenação automática baseada no contexto da tarefa

🎤 Processamento de Voz Avançado

Voice Activity Detection (VAD) em tempo real
Streaming bidirecional com latência mínima
Múltiplos engines STT/TTS (Whisper, Google, ElevenLabs)
Pipeline otimizado STT → LLM → TTS

🧠 Memória Semântica e Aprendizado

Base vetorial com ChromaDB para busca semântica
Aprendizado adaptativo de preferências do usuário
Clustering automático de tópicos relacionados
Contexto persistente entre sessões

🤖 Integração LLM Universal

8+ provedores suportados: OpenAI, Anthropic, Google, Groq, NVIDIA, xAI
40+ modelos disponíveis através de interface unificada
Estado persistente com LangGraph e SQLite
Factory pattern para criação dinâmica de chains

⚡ Performance Otimizada

Cache inteligente com hit rate >90%
Balanceamento de carga entre provedores
Monitoramento em tempo real com métricas detalhadas
Deploy containerizado ready-to-production

🚀 Quick Start

Instalação

# Clone o repositório
git clone <repository-url>
cd gianna

# Instalar dependências
poetry install

# Configurar ambiente
cp .env.example .env
# Edite .env com suas chaves de API

Uso Básico

# Assistente conversacional simples
from gianna.core.langgraph_chain import LangGraphChain

assistente = LangGraphChain(
    "gpt4",
    "Você é um assistente inteligente e amigável."
)

# Conversa com estado persistente
response = assistente.invoke({
    "input": "Olá! Meu nome é João."
}, session_id="user123")

print(response["output"])
# "Olá João! Prazer em conhecê-lo. Como posso ajudá-lo hoje?"

# Próxima mensagem lembra o contexto
response = assistente.invoke({
    "input": "Você lembra meu nome?"
}, session_id="user123")

print(response["output"])
# "Claro! Você é o João. Como posso ajudá-lo?"

Sistema Multi-Agente

from gianna.coordination.orchestrator import AgentOrchestrator
from gianna.agents.react_agents import CommandAgent, AudioAgent

# Configurar orquestrador
orchestrator = AgentOrchestrator()

# Registrar agentes especializados
orchestrator.register_agent(CommandAgent(llm))
orchestrator.register_agent(AudioAgent(llm))

# Processamento inteligente
resultado = orchestrator.process_request(
    "Execute um backup do sistema e me notifique por voz"
)

Assistente de Voz em Tempo Real

from gianna.workflows.voice_interaction import VoiceWorkflow
import asyncio

async def demo_voz():
    workflow = VoiceWorkflow()

    print("🎤 Assistente ativo! Pode falar...")
    await workflow.start_conversation()

# Executar
asyncio.run(demo_voz())

📋 Configuração

Variáveis de Ambiente

# APIs dos LLMs (pelo menos uma necessária)
OPENAI_API_KEY=sk-...
GOOGLE_API_KEY=...
ANTHROPIC_API_KEY=...
ELEVEN_LABS_API_KEY=...

# Configurações padrão
LLM_DEFAULT_MODEL=gpt4
TTS_DEFAULT_TYPE=google
LANGUAGE=pt-br

# Performance
CACHE_ENABLED=true
MAX_CONCURRENT_SESSIONS=100
DATABASE_PATH=gianna_state.db

# Monitoramento
PERFORMANCE_MONITORING=true
LOG_LEVEL=INFO

Modelos Suportados

Provedor	Modelos	Status
OpenAI	GPT-3.5, GPT-4, GPT-4 Turbo	✅ Ativo
Anthropic	Claude, Claude Instant	✅ Ativo
Google	Gemini, Gemini Pro	✅ Ativo
Groq	Llama2, Mixtral	✅ Ativo
xAI	Grok	✅ Ativo
NVIDIA	Llama2-70B	✅ Ativo
Ollama	Modelos locais	✅ Ativo
Cohere	Command, Command-R	✅ Ativo

🏗️ Arquitetura - 5 Fases

Fase 1: Fundação LangGraph ✅

Sistema de estado central com LangGraph
Persistência automática com SQLite
Compatibilidade com factory methods existentes
Workflows stateful para conversações

Fase 2: Sistema Multi-Agente ✅

Agentes ReAct especializados (Comando, Áudio, Síntese)
Ferramentas integradas (Shell, FileSystem, Audio)
Orquestração inteligente com roteamento automático
Execução paralela e sequencial coordenada

Fase 3: Pipeline de Voz ✅

Voice Activity Detection em tempo real
Streaming de áudio bidirecional
Integração STT → LLM → TTS otimizada
Suporte a múltiplos idiomas e engines

Fase 4: Recursos Avançados ✅

Memória semântica com ChromaDB
Aprendizado adaptativo de preferências
Clustering automático de tópicos
Sistema de recomendações inteligente

Fase 5: Otimização e Produção ✅

Cache inteligente multi-layer
Monitoramento e métricas em tempo real
Balanceamento de carga entre APIs
Deploy containerizado e CI/CD

📚 Documentação

📖 Guias de Usuário

Guia Rápido - Primeiros passos e uso básico
Tutorial Completo - Notebooks interativos
Casos de Uso - Exemplos práticos por fase

🔧 Documentação Técnica

API Reference - Documentação completa da API
Guia do Desenvolvedor - Extensão e customização
Arquitetura - Visão técnica detalhada

🚀 Deploy e Produção

Guia de Deploy - Deploy em diferentes ambientes
Docker & Kubernetes - Containerização
Monitoramento - Observabilidade

💻 Exemplos Práticos

🎯 Exemplos Básicos

# Ver diretório /examples/basic/
- conversational_assistant.py    # Assistente básico
- voice_commands.py             # Comandos por voz
- multi_session.py              # Múltiplas sessões

🚀 Exemplos Avançados

# Ver diretório /examples/advanced/
- multi_agent_orchestration.py  # Coordenação complexa
- real_time_voice_assistant.py  # Voz em tempo real
- semantic_memory_system.py     # Memória semântica
- enterprise_deployment.py      # Deploy empresarial

🎓 Tutoriais Interativos

# Ver diretório /notebooks/
- tutorial_fase1_langgraph.ipynb      # Fundação LangGraph
- tutorial_fase2_multiagent.ipynb    # Sistema Multi-Agente
- tutorial_fase3_voice.ipynb         # Pipeline de Voz
- tutorial_complete_workflow.ipynb   # Workflow Completo

⚡ Performance

Benchmarks de Production

Métrica	Objetivo	Atual	Status
Latência de Resposta	<2s	1.2s	✅
Throughput	>50/min	75/min	✅
Uptime	>99.5%	99.8%	✅
Cache Hit Rate	>85%	92%	✅
Uso de Memória	<500MB	280MB	✅

Otimizações Implementadas

⚡ Cache inteligente com invalidação automática
🔄 Pool de conexões para APIs externas
📦 Lazy loading de componentes pesados
🎯 Batch processing para operações em lote
📊 Profiling contínuo com otimização automática

🛠️ Desenvolvimento

Setup do Ambiente

# Instalar Poetry
curl -sSL https://install.python-poetry.org | python3 -

# Configurar ambiente de desenvolvimento
poetry install --with dev
poetry shell

# Configurar pre-commit
pre-commit install

# Executar testes
poetry run pytest

# Linting e formatação
poetry run black .
poetry run flake8
poetry run mypy gianna/

Estrutura do Projeto

gianna/
├── gianna/                 # Código principal
│   ├── core/              # Sistema central (Fase 1)
│   ├── agents/            # Sistema multi-agente (Fase 2)
│   ├── audio/             # Processamento de áudio (Fase 3)
│   ├── memory/            # Memória semântica (Fase 4)
│   ├── optimization/      # Otimizações (Fase 5)
│   └── workflows/         # Fluxos de trabalho
├── docs/                  # Documentação completa
├── examples/              # Exemplos práticos
├── notebooks/             # Tutoriais interativos
├── tests/                 # Testes automatizados
└── resources/             # Recursos estáticos

Contribuindo

Fork o repositório
Crie um branch para sua feature (git checkout -b feature/nova-funcionalidade)
Commit suas mudanças (git commit -m 'Adiciona nova funcionalidade')
Push para o branch (git push origin feature/nova-funcionalidade)
Abra um Pull Request

🤝 Comunidade e Suporte

📞 Canais de Suporte

💬 Discord: discord.gg/gianna
📧 Email: [email protected]
🐛 Issues: GitHub Issues
💡 Discussões: GitHub Discussions

📊 Status do Projeto

✅ Production Ready: Todas as 5 fases implementadas
🧪 Testado: >95% coverage, testes automatizados
📚 Documentado: Guias completos e exemplos práticos
🔄 Ativo: Desenvolvimento contínuo e suporte ativo

🎯 Roadmap Futuro

🌐 Web Interface: Dashboard web para gerenciamento
📱 Mobile SDK: SDK para aplicações móveis
🔌 Plugin System: Sistema de plugins extensível
🌍 Multi-idioma: Suporte expandido a mais idiomas

📄 Licença

Este projeto está licenciado sob a Apache-2.0 license - veja o arquivo LICENSE para detalhes.

🙏 Agradecimentos

LangChain/LangGraph - Framework base para workflows
OpenAI, Anthropic, Google - Provedores de LLM
ChromaDB - Base de dados vetorial
Comunidade Python - Bibliotecas e ferramentas

⭐ Se este projeto foi útil, não esqueça de dar uma estrela!

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
config		config
docs		docs
examples		examples
gianna		gianna
monitoring		monitoring
notebooks		notebooks
scripts		scripts
tests		tests
.env.example		.env.example
.flake8		.flake8
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
ARCHITECTURE.md		ARCHITECTURE.md
LICENSE		LICENSE
USAGE.md		USAGE.md
main.py		main.py
pyproject.toml		pyproject.toml
pytest.ini		pytest.ini
readme.md		readme.md
setup.py		setup.py
tasks.py		tasks.py
test_vad.py		test_vad.py
test_workflows_basic.py		test_workflows_basic.py

Uh oh!

License

Uh oh!

marvinbraga/gianna

Folders and files

Latest commit

History

Repository files navigation

Gianna - Assistente de Voz Inteligente

✨ Principais Características

🧠 Sistema Multi-Agente Inteligente

🎤 Processamento de Voz Avançado

🧠 Memória Semântica e Aprendizado

🤖 Integração LLM Universal

⚡ Performance Otimizada

🚀 Quick Start

Instalação

Uso Básico

Sistema Multi-Agente

Assistente de Voz em Tempo Real

📋 Configuração

Variáveis de Ambiente

Modelos Suportados

🏗️ Arquitetura - 5 Fases

Fase 1: Fundação LangGraph ✅

Fase 2: Sistema Multi-Agente ✅

Fase 3: Pipeline de Voz ✅

Fase 4: Recursos Avançados ✅

Fase 5: Otimização e Produção ✅

📚 Documentação

📖 Guias de Usuário

🔧 Documentação Técnica

🚀 Deploy e Produção

💻 Exemplos Práticos

🎯 Exemplos Básicos

🚀 Exemplos Avançados

🎓 Tutoriais Interativos

⚡ Performance

Benchmarks de Production

Otimizações Implementadas

🛠️ Desenvolvimento

Setup do Ambiente

Estrutura do Projeto

Contribuindo

🤝 Comunidade e Suporte

📞 Canais de Suporte

📊 Status do Projeto

🎯 Roadmap Futuro

📄 Licença

🙏 Agradecimentos

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages