ANALISTA DE SRE PL – Remoto

ANALISTA DE SRE PL – Remoto

ANALISTA DE SRE PL – Remoto

Vagas Inmetrics

Gupy

Brasil

1 hora atrás

Nenhuma candidatura

Sobre

Na Inmetrics, a inovação e a excelência operam lado a lado em um ambiente de trabalho colaborativo, saudável e dinâmico. Nossa cultura valoriza o aprendizado constante, a transparência na comunicação e a flexibilidade, criando um espaço onde cada profissional pode se desenvolver e alcançar o seu máximo potencial.​Nosso time é apaixonado por tecnologia e comprometido com entregas de valor real para os nossos clientes. Nosso diferencial é a eficiência digital. ​Pessoas são o nosso maior ativo, por isso, investimos em oportunidades que vão além de um salário competitivo, proporcionamos benefícios diferenciados em relação ao mercado e um ambiente de trabalho saudável e reconhecido por nossos colaboradores.​#VemparainmetricsResponsabilidades e atribuições*Requisitos e Qualificações: - Experiência com sistemas operacionais Linux e Windows. - Experiência com plataformas de orquestração e gerenciamento de sistemas, como Kubernetes, Docker. - Vivencia na cloud AWS. - Habilidades na práticas de DEVOPS. - Experiência com ferramentas de observabilidade e monitoramento em tempo real - Habilidade em desenvolver e manter scripts de automação utilizando linguagens como Python, Bash ou PowerShell. - Diferencial: - Conhecimento em redes de computadores, com conhecimento de protocolos, configuração e segurança de redes. - Conhecimento em tecnologias de middleware, como Oracle WebLogic, e habilidade para gerenciar e otimizar sua performance. - Familiaridade com processos de gestão de vulnerabilidades e aplicação de patches. - Certificações relevantes em áreas de SRE, DevOps ou administração de sistemas serão consideradas um diferencial.Requisitos e qualificações*- Implementar e gerenciar pipelines de CI/CD, garantindo a automação e eficiência dos processos de deploy. - Monitorar a infraestrutura e os serviços, utilizando ferramentas como Dynatrace, Prometheus, Grafana, ELK Stack ou Datadog, para assegurar a alta disponibilidade e desempenho. - Atuar na resolução de incidentes e problemas críticos, colaborando com times de desenvolvimento e operações para identificação de causas raiz e prevenção de recorrências. - Desenvolver e manter scripts de automação para gerenciamento de infraestrutura como código (IaC) utilizando Terraform, Ansible ou similares. - Projetar e implementar soluções de recuperação de desastres e planos de continuidade de negócios. - Garantir a escalabilidade e resiliência dos sistemas através de práticas de engenharia de confiabilidade, como testes de carga, estresse e caos.