Visão Geral do Cargo
Construir e manter toda a camada de dados da plataforma: desde ingestão e transformação até armazenamento e indexação para RAG, garantindo qualidade, performance e escalabilidade.
Responsabilidades Principais
Requisitos Obrigatórios
Linguagens e Ferramentas
• Python (Pandas, SQLAlchemy, Airflow/Prefect ou similar)
• SQL avançado (PostgreSQL)
Bancos de Dados & Armazenamento
• Supabase (PostgreSQL)
• Experiência com banco de vetores (Pinecone ou equivalente)
Orquestração & Automação
• n8n (criação de workflows, custom nodes, triggers)
• Docker / Docker Compose
Cloud & Infraestrutura
• AWS, GCP ou Azure (IAM, S3, RDS, serviços gerenciados)
• CI/CD (GitHub Actions, GitLab CI)
Data Quality & Governança
• Ferramentas/abordagens de data profiling, testes de ingestão e monitoramento
Diferenciais Desejáveis
• Experiência com dbt para versionamento de transformações
• Conhecimento em GraphQL e APIs REST
• Familiaridade com Kafka/RabbitMQ ou arquiteturas event‑driven
• Noções de DevOps em Kubernetes (Helm, Prometheus, Grafana)
• Experiência com metodologias de Data Mesh/Data Fabric
• Inglês avançado para leitura de documentação técnica