HORTOLANDIA, BRA
11 hours ago
SRE Specialist
**Introduction** Nesta função, você trabalhará no IBM Client Innovation Center (CIC), onde oferecemos profundo conhecimento técnico e de indústria para uma ampla gama de clientes do setor público e privado em todo o mundo. Esses centros oferecem aos nossos clientes habilidades e conhecimento técnico para impulsionar a inovação e a adoção de novas tecnologias. A carreira em IBM Consulting é baseada em relacionamentos de longo prazo e estreita colaboração com clientes em todo o mundo. Você trabalhará com pessoas visionárias em diversos setores para melhorar a nuvem híbrida e a jornada de IA das empresas mais inovadoras e valiosas do mundo. Sua capacidade de acelerar o impacto dos projetos e realizar mudanças significativas para os clientes é possibilitada por nosso ecossistema de parcerias estratégicas e nossas plataformas de tecnologia robustas em todo o portfólio da IBM, incluindo Software e Red Hat. A curiosidade e a busca constante pelo conhecimento são a base para o sucesso da IBM Consulting. Em sua função, te incentivaremos a desafiar padrões, investigar ideias e apresentar soluções criativas que resultem em um impacto inovador para uma ampla rede de clientes. Nossa cultura de evolução e empatia se concentra no crescimento de carreira de longo prazo e nas oportunidades de desenvolvimento em um ambiente que abraça suas habilidades e experiências únicas. **Your role and responsibilities** '- Garantir a alta disponibilidade, confiabilidade e desempenho dos sistemas por meio de práticas de engenharia de confiabilidade de sites (Site Reliability Engineering - SRE). - Implementar e gerenciar automações para tarefas repetitivas e processos operacionais, reduzindo esforço manual e riscos. - Monitorar e otimizar sistemas críticos, infraestrutura e aplicações utilizando ferramentas de observabilidade e monitoramento. - Analisar e gerenciar incidentes críticos, liderando a identificação de causa raiz e implementação de soluções definitivas. - Desenvolver e manter SLIs, SLOs e SLAs, alinhando-os com as metas de negócios. - Trabalhar em colaboração com equipes de desenvolvimento, operações e segurança para implementar pipelines CI/CD robustos e promover a infraestrutura como código (IaC). - Garantir a resiliência do sistema por meio de estratégias de chaos engineering, testes de carga e automação de failovers. - Realizar otimização de custos em ambientes de nuvem e melhorar a eficiência operacional. - Sólido conhecimento em design e implementação de arquiteturas resilientes e escaláveis. **Required technical and professional expertise** '- Proficiência em práticas de SRE, como definição de SLIs, SLOs e SLAs, e sua integração nos sistemas. - Experiência com automação avançada e gerenciamento de infraestrutura em larga escala. - Expertise em monitoramento e otimização de microsserviços e sistemas distribuídos. - Experiência com Kubernetes e gestão de clusters em produção. - Conhecimento avançado em práticas de chaos engineering e teste de resiliência. - Proatividade e habilidade para resolver problemas em cenários complexos. - Boa comunicação para trabalhar de forma colaborativa com equipes multidisciplinares. - Capacidade de priorizar demandas e trabalhar em ambientes dinâmicos. - Experiência em SRE, DevOps ou funções relacionadas. IBM is committed to creating a diverse environment and is proud to be an equal-opportunity employer. All qualified applicants will receive consideration for employment without regard to race, color, religion, sex, gender, gender identity or expression, sexual orientation, national origin, caste, genetics, pregnancy, disability, neurodivergence, age, veteran status, or other characteristics. IBM is also committed to compliance with all fair employment practices regarding citizenship and immigration status.
Confirmar seu email: Enviar Email