Site Reliability Engineer

Site Reliability Engineer

Site Reliability Engineer

Enter

São Paulo, State of São Paulo, Brazil

5 horas atrás

Nenhuma candidatura

Sobre

  • A Enter (anteriormente Talisman AI) foi fundada em 2023 com a missão de tornar o Brasil um protagonista em Inteligência Artificial. Unimos a expertise humana à eficiência da IA para ajudar grandes empresas da América Latina a otimizar processos críticos de alto volume e que exigem intenso trabalho manual. Iniciamos nossa jornada aplicando IA para criar defesas jurídicas personalizadas em larga escala, permitindo que grandes empresas reduzam custos advocatícios e aumentem suas taxas de êxito. Atendemos clientes como Nubank, Banco BMG, iFood, SulAmérica, Light, Banco Inter, Banco C6, entre outros.
  • Estamos buscando SRE (Site Reliability Engineer) experientes para desenvolver a fundação de nossa plataforma. Este papel é fundamental para garantir a escalabilidade, observabilidade, resiliência e segurança de nossa operação.

O SRE na Enter desenvolve a plataforma de infraestrutura utilizada pelos engenheiros da empresa - aproveitando e refinando sistemas já existentes, além de construir novos serviços que aumentem a escalabilidade e a usabilidade. É uma posição com uma atuação ampla na gestão da cloud (AWS), serviços de observabilidade, mensageria, armazenamento, controle de incidentes e segurança. Não é necessário ter experiência prévia com todos esses assuntos, desde que você carregue uma curiosidade nata e uma capacidade de aprender conceitos difíceis rapidamente. Na prática

  • Contribuir diretamente para o desenvolvimento de funcionalidades e manutenção de serviços de infraestrutura para gestão, observabilidade, segurança, mensageria, escalabilidade, compliance e resposta a incidentes.
  • Manter e otimizar serviços de infraestrutura como Kubernetes, NATS, Postgres, Redis, Istio, Grafana, Prometheus, etc.
  • Definir padrões de monitoramento e observabilidade para serviços de infraestrutura;
  • Realizar troubleshooting e assistir na resolução de incidentes em produção;
  • Gerenciar e melhorar ferramentas e processos relacionados à gestão de infraestrutura em toda a empresa (padrões de Infrastructure-as-code, design de CI/CD, etc.);
  • Desenvolver os sistemas necessários para replicar nossa infraestrutura, gerando ambientes especializados sobre demanda.

O que valorizamos

  • Profissionais que não se contentam com respostas superficiais e mergulham nos detalhes.
  • Baixa necessidade de reconhecimento individual, priorizando o resultado acima do crédito pessoal.
  • Capacidade excepcional de enfrentar problemas abertos em ambientes não estruturados.
  • Disposição para aprender, orientar, liderar e seguir conforme necessário.
  • Senso de urgência desproporcional, mantendo em mente a escalabilidade e a criação de processos replicáveis para garantir o sucesso a longo prazo.
  • Pessoas genuinamente curiosas e que conseguem aprender coisas difíceis rapidamente.

Idealmente, você tem

  • Pelo menos 3 anos de experiência profissional como Backend Engineer, SRE, Cloud Engineer ou similar.
  • Usuario avancado de Linux e AWS.
  • Experiência desenvolvendo e/ou mantendo Kubernetes, NATS, Istio, Grafana, Prometheus, Terraform (Tofu).

Diferenciais

  • Graduação em Ciência da Computação, Engenharia ou áreas correlatas.
  • Familiaridade com Proficiência em Python.