Engenheiro de Computação com mais de 5 anos de experiência em desenvolvimento de software, com especialização em Inteligência Artificial Generativa, Machine Learning e NLP. Atuo na arquitetura, desenvolvimento e escalabilidade de soluções baseadas em LLMs e processamento de grandes volumes de dados.
Trabalho na interseção entre pesquisa e produção — construindo sistemas multiagentes com CrewAI, LangChain e Google ADK, pipelines de RAG e CAG, além de infraestruturas híbridas entre GCP e AWS. Atualmente focado em Legal Tech na Lopti, onde cuido de performance, latência e observabilidade de agentes de IA.
Em paralelo, possuo experiência acadêmica com modelos descritivos para Data Streams e sou coautor de artigos publicados na Science Direct (2025) e Springer Nature (2023). Certificado em LLMs pela Universidade de Stanford.
Desenvolvimento de soluções baseadas em LLMs e arquiteturas de agentes com foco em performance, escalabilidade e qualidade de resposta no setor de Legal Tech. Orquestração de sistemas multiagentes com CrewAI, LangChain e Google ADK para extração de informações em documentos jurídicos. Implementação de pipelines RAG e CAG com cache semântico para redução de latência e custos. Monitoramento de performance e tokens via Langfuse e GCP.
Desenvolvimento de sistema de classificação de criadores de conteúdo e análise de sentimentos integrado aos modelos Gemini e GPT. Infraestrutura híbrida com AWS (filas e bancos de dados) e GCP (Cloud Run) para processamento em larga escala. Implementação de chatbot com RAG usando LangChain e aplicação de few-shot learning para refinamento de prompts.
Desenvolvimento de modelos de NLP para classificação de textos judiciais com Python e LLMs. Criação de robôs de web scraping com Selenium para coleta e agregação de dados de múltiplas fontes. Automação de processos em Google Sheets via macros JavaScript.
Projeto de extensão em parceria com o Departamento de Medicina da UFSCar para desenvolvimento de aplicativo mobile de apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. Desenvolvimento com Flutter e Firebase em equipe multidisciplinar.
Publicação de artigo sobre modelos de machine learning baseados em densidade para grandes volumes de dados não rotulados (Data Streams).
Publicação de artigo sobre algoritmos de clustering escaláveis para Data Streams com dados não rotulados.
Certificação em Large Language Models pela Universidade de Stanford, abrangendo fundamentos, fine-tuning, RAG e aplicações práticas de LLMs.
Formação em engenharia com ênfase em sistemas computacionais, algoritmos, desenvolvimento de software e inteligência artificial.
Sistema com orquestrador + agentes especializados (busca web, código, síntese) para pesquisa autônoma. Utiliza LangGraph com memória persistente e RAG sobre base de papers científicos.
Pipeline de extração e análise de documentos PDFs complexos usando OCR + LLM + RAG. Processa contratos jurídicos e retorna respostas contextualizadas com citações.
Framework para fine-tuning eficiente de LLMs com LoRA/QLoRA. Inclui geração de dataset, treinamento, avaliação e deploy automatizados via CLI.
Faça qualquer pergunta sobre minha trajetória, projetos, skills ou experiências.
chat.js para ativar o agente real. Crie em console.groq.com
Sinta-se à vontade para entrar em contato para trocar ideias sobre IA, sistemas inteligentes ou qualquer outro assunto relacionado à engenharia de software.
Se quiser conhecer mais sobre meu trabalho, confira meu GitHub ou me encontre no LinkedIn.