Agente IA · NOUSTEC

Por que automatizamos o front line

Vendemos consultoria em IA aplicada. Não daria pra fazer isso usando um time humano de SDRs lendo script pronto — ficaria inconsistente com o que defendemos. O agente que te atende é o mesmo padrão de solução que entregamos ao cliente: LLM com tools, contexto persistido, cadência humana, auditável e com fallback claro.

O blog de /noticias é gerado por agentes. O WhatsApp é atendido por agente SDR. As soluções que projetamos para nossos clientes seguem a mesma filosofia.

O fluxo

Da sua mensagem ao agendamento: 5 etapas.

Tudo acontece em segundos, com cadência simulada para uma experiência natural.

Cliente abre o WhatsApp

Mensagem enviada pelo cliente entra no número oficial conectado via Evolution API.

Webhook + persistência

Evolution chama nosso endpoint Astro. Mensagem é validada, deduplicada e gravada no Postgres.

Agente SDR pensa

Histórico da conversa + estado do lead viram contexto para o LLM. O agente decide próxima pergunta e tools a chamar.

Resposta com cadência

Agente envia "digitando…" e espera de 1 a 6 segundos antes de enviar. Respostas longas chegam em 2 ou 3 mensagens — como uma pessoa real.

Qualificação + handoff

Quando o BANT (nome, empresa, dor, prazo) está mapeado, marca MQL e propõe agendamento. Imagem ou áudio longo → transfere imediatamente para humano.

Princípios

Como ele pensa.

PRINCÍPIO 01

Transparência por padrão.

Na primeira mensagem o agente se identifica como IA. Sem fingir que é humano, sem disfarces. A confiança vem da honestidade técnica.

PRINCÍPIO 02

Qualifica sem soar como formulário.

Em vez de despejar 5 perguntas, o agente conversa — captura nome, empresa, dor e prazo ao longo de 4 a 6 mensagens, sempre 1 ou 2 perguntas por turno.

PRINCÍPIO 03

Humano quando precisa.

Cliente pediu "falar com pessoa", mandou foto/print/documento, áudio longo demais? Transferência imediata. Sem reter cliente em loop de IA.

PRINCÍPIO 04

Auditável de ponta a ponta.

Toda mensagem (inbound e outbound), tokens consumidos, modelo usado, tools chamadas e latência ficam registrados. Cada conversa é reproduzível.

Stack & arquitetura

Componentes auditáveis.

Cada decisão técnica é escolhida para custo, confiabilidade e reprodutibilidade. Multi-provider em LLM e transcrição garante que uma falha pontual não derruba o atendimento.

Evolution API · número oficial · multi-instância

LLM

DeepSeek (primário) · Groq (fallback) · function calling

Áudio

Groq Whisper-large-v3 · transcrição em português

Estado

PostgreSQL + Drizzle · idempotência por message ID

Cadência

Typing indicator + delay proporcional ao tamanho

Observabilidade

Transcript completo em /admin/leads · tokens & latência por mensagem

Métricas em tempo real

Operação medida.

Dados agregados — nenhuma informação pessoal exposta.

Conversas iniciadas

Leads qualificados (MQL)

Mensagens trocadas

Experimente

Converse com o agente agora.

Manda um oi pelo WhatsApp. Em segundos você vai conversando com o agente IA. Se quiser, peça pra falar com humano a qualquer momento — ele transfere na hora.

Abrir WhatsApp Ver casos →

Atendido por um agente de IA real.