All jobs
AliceDevOps
DevOps Engineer
RemotoPosted today
Na Alice, a gente não oferece um lugar para assistir da arquibancada — você vai entrar na arena de uma das jornadas de crescimento mais ousadas da América Latina em tecnologia e saúde. Como Software Engineer, você vai construir tecnologia de ponta com impacto direto em melhorar a vida das pessoas.
Location: Remoto
Responsibilities
- Construir e evoluir plataforma em AWS e Kubernetes, com soluções sustentáveis e escaláveis.
- Desenhar e manter Infrastructure as Code (Terraform, Helm) com versionamento, revisão e testes.
- Decompor mudanças de plataforma em tarefas que fazem sentido para agentes — ordem, dependências, paralelismo, nível de autonomia.
- Colaborar com decisões de arquitetura cross squads.
- Manter nossas ADRs, documentações, rules e skills atualizados.
- Construir e evoluir pipelines de CI/CD e estratégias de release (canary, blue/green, rollback) via agentes.
- Trabalhar spec-first em todo o ciclo — planejar, codar, debugar, testar, documentar, revisar diffs e iterar.
- Ser responsável pelo ciclo de vida da plataforma (deploy, métricas, alarmes, SLOs) e pelos guardrails que mantêm a qualidade (testes de infra, linting, policy checks, security scans).
- Usar agentes também em operação, investigando incidentes via MCPs (Datadog, logs, traces, GitHub).
- Participar do on-call, evoluindo runbooks e automações que reduzem ruído e MTTR.
- Garantir alto desempenho, alta disponibilidade e segurança dos sistemas.
- Contribuir com os desafios de plataforma e de todo o time de tecnologia, compartilhando ideias, soluções, módulos de IaC, arquiteturas, skills, subagents, rules e workflows reutilizáveis.
- Evoluir os arquivos de contexto do seu domínio para elevar a qualidade do que os agentes produzem em mudanças de infraestrutura.
- Publicar e manter skills no nosso marketplace interno.
- Aprimorar a experiência de desenvolvimento na Alice (tooling de plataforma, ambientes efêmeros, deploys self-service, observabilidade) e mentorar colegas no mindset de orquestrador.
- Trabalhar junto com pessoas Engenheiras de Software, Designers e Product Managers para entender as dores dos usuários e dos times internos, criando as melhores soluções de plataforma.
- Ajudar o time a decidir onde cabe automação agentic e onde queremos judgement humano, especialmente em mudanças críticas de produção e em fluxos com cuidado, dados clínicos e decisões regulatórias.
- Colaborar para o fortalecimento de cultura do time, participando ativamente dos ritos e processos da squad.
Requirements
- Experiência sólida operando infraestrutura em AWS (VPC, IAM, EC2, EKS/ECS, RDS, S3, networking, custos)
- Proficiência com Kubernetes em produção (deployments, autoscaling, networking, RBAC, observabilidade, troubleshooting)
- Experiência sólida com Infrastructure as Code (Terraform, Helm) — modularização, versionamento, testes e revisão de mudanças
- Experiência com pipelines de CI/CD (GitHub Actions, Jenkins ou equivalente) e estratégias de release (blue/green, canary, rollback, feature flags)
- Vivência com sistemas distribuídos / micro-serviços e suas armadilhas operacionais
- Forte prática com observabilidade e monitoramento (Datadog, Prometheus, logs, traces, definição de SLIs/SLOs e alarmes)
- Experiência com as melhores práticas de segurança e privacidade de dados (gestão de secrets, least privilege, hardening, varreduras de vulnerabilidade, conformidade)
- Capacidade de codar quando necessário (Python, Go, Bash ou similar) para construir tooling de plataforma e automações
- Experiência sólida como liderança de projetos técnicos de plataforma (migrações, padronizações cross squad, ferramentas internas, decisões arquiteturais)
- Capacidade de adaptar sua forma de trabalho continuamente para extrair o máximo de benefício dos melhores modelos / harnesses / frameworks de AI.
- Uso regular de ferramenta agentic em modo agente, não apenas autocomplete (Claude Code, Cursor, Augment Code, Codex ou equivalente)
- Spec-driven development em todo o ciclo: planeja antes de gerar, revisa diffs, usa testes como verificação, e aplica o mesmo rigor em debugging, documentação e investigação de incidentes
- Configura e mantém CLAUDE.md, AGENTS.md, .cursorrules e equivalentes; sabe dividir tarefas em codebases grandes
- Conhece modos de falha (hallucination, context rot, loops, sycophancy) e ajusta o processo a partir deles
- Já criou skill, subagent, rule, template de prompt ou workflow que o time adotou
- Decide o que delega ao agente e o que exige revisão humana
- Diferenciais: orquestrar múltiplas instâncias/worktrees em paralelo; operar long-running agents; escrever evals para skills, prompts e workflows (medir qualidade de output e detectar regressão); avaliar ferramentas criticamente (custo, qualidade, segurança, privacidade); liderar adoção de agentic development em um time ou organização.
Benefits
- Fazemos o nosso melhor para compensar de forma competitiva.
- Sempre fazemos nossa melhor oferta.
- Não negociamos (isso é bom para você).
Similar remote jobs
yesterday
yesterday
yesterday