Pular para conteúdo
NOUSTEC | Inteligência e Inovação
Falar com especialista
Por que automatizamos o front line

Vendemos consultoria em IA aplicada. Não daria pra fazer isso usando um time humano de SDRs lendo script pronto — ficaria inconsistente com o que defendemos. O agente que te atende é o mesmo padrão de solução que entregamos ao cliente: LLM com tools, contexto persistido, cadência humana, auditável e com fallback claro.

O blog de /noticias é gerado por agentes. O WhatsApp é atendido por agente SDR. As soluções que projetamos para nossos clientes seguem a mesma filosofia.

O fluxo

Da sua mensagem ao agendamento: 5 etapas.

Tudo acontece em segundos, com cadência simulada para uma experiência natural.

01

Cliente abre o WhatsApp

Mensagem enviada pelo cliente entra no número oficial conectado via Evolution API.

02

Webhook + persistência

Evolution chama nosso endpoint Astro. Mensagem é validada, deduplicada e gravada no Postgres.

03

Agente SDR pensa

Histórico da conversa + estado do lead viram contexto para o LLM. O agente decide próxima pergunta e tools a chamar.

04

Resposta com cadência

Agente envia "digitando…" e espera de 1 a 6 segundos antes de enviar. Respostas longas chegam em 2 ou 3 mensagens — como uma pessoa real.

05

Qualificação + handoff

Quando o BANT (nome, empresa, dor, prazo) está mapeado, marca MQL e propõe agendamento. Imagem ou áudio longo → transfere imediatamente para humano.

Princípios

Como ele pensa.

PRINCÍPIO 01

Transparência por padrão.

Na primeira mensagem o agente se identifica como IA. Sem fingir que é humano, sem disfarces. A confiança vem da honestidade técnica.

PRINCÍPIO 02

Qualifica sem soar como formulário.

Em vez de despejar 5 perguntas, o agente conversa — captura nome, empresa, dor e prazo ao longo de 4 a 6 mensagens, sempre 1 ou 2 perguntas por turno.

PRINCÍPIO 03

Humano quando precisa.

Cliente pediu "falar com pessoa", mandou foto/print/documento, áudio longo demais? Transferência imediata. Sem reter cliente em loop de IA.

PRINCÍPIO 04

Auditável de ponta a ponta.

Toda mensagem (inbound e outbound), tokens consumidos, modelo usado, tools chamadas e latência ficam registrados. Cada conversa é reproduzível.

Stack & arquitetura

Componentes auditáveis.

Cada decisão técnica é escolhida para custo, confiabilidade e reprodutibilidade. Multi-provider em LLM e transcrição garante que uma falha pontual não derruba o atendimento.

WhatsApp
Evolution API · número oficial · multi-instância
LLM
DeepSeek (primário) · Groq (fallback) · function calling
Áudio
Groq Whisper-large-v3 · transcrição em português
Estado
PostgreSQL + Drizzle · idempotência por message ID
Cadência
Typing indicator + delay proporcional ao tamanho
Observabilidade
Transcript completo em /admin/leads · tokens & latência por mensagem
Métricas em tempo real

Operação medida.

Dados agregados — nenhuma informação pessoal exposta.

2
Conversas iniciadas
1
Leads qualificados (MQL)
32
Mensagens trocadas
Experimente

Converse com o agente agora.

Manda um oi pelo WhatsApp. Em segundos você vai conversando com o agente IA. Se quiser, peça pra falar com humano a qualquer momento — ele transfere na hora.