SÃO PAULO, BRA
24 hours ago
Arquiteto(a) de Infraestrutura em SRE e Observabilidade
**Introduction** A career in IBM Consulting is rooted by long-term relationships and close collaboration with clients across the globe. You'll work with visionaries across multiple industries to improve the hybrid cloud and AI journey for the most innovative and valuable companies in the world. Your ability to accelerate impact and make meaningful change for your clients is enabled by our strategic partner ecosystem and our robust technology platforms across the IBM portfolio; including Software and Red Hat. Curiosity and a constant quest for knowledge serve as the foundation to success in IBM Consulting. In your role, you'll be encouraged to challenge the norm, investigate ideas outside of your role, and come up with creative solutions resulting in ground breaking impact for a wide network of clients. Our culture of evolution and empathy centers on long-term career growth and development opportunities in an environment that embraces your unique skills and experience. **Your role and responsibilities** Buscamos um(a) Arquiteto(a) de Infraestrutura com atuação em Always On, Observabilidade e SRE, responsável por garantir a alta disponibilidade e confiabilidade dos sistemas críticos. Esse(a) profissional será referência técnica, conduzindo a evolução da disponibilidade técnica para a disponibilidade efetiva, com foco em arquitetura, métricas, automação e monitoramento integrado ao ServiceNow. Atuação Estratégica * Atuar como referência técnica na jornada Always On, garantindo visibilidade dos indicadores de disponibilidade. * Assegurar que sistemas críticos estejam instrumentados, monitorados e integrados ao ServiceNow. Arquitetura de Observabilidade * Definir e liderar a arquitetura de monitoramento e observabilidade para aplicações críticas. * Apoiar a definição de SLIs e SLOs e revisar ANS/SLAs com foco em alta disponibilidade. * Garantir health checks, probes e métricas nos componentes críticos. Instrumentação e Integração * Orientar a instrumentação de APM e monitoramento (Dynatrace, AppDynamics, Prometheus, Grafana). * Automatizar a coleta de métricas de disponibilidade, latência, throughput e erros. * Criar dashboards técnicos e executivos e garantir integração com o ServiceNow. Confiabilidade e Resiliência * Integrar métricas de MTBF e MTTR à disponibilidade efetiva. * Conduzir RCAs técnicos em incidentes. * Propor melhorias arquiteturais de resiliência (auto-scaling, self-healing, redundância, failover e testes). DevOps e Boas Práticas * Colaborar com times de desenvolvimento, operações e segurança. * Apoiar CI/CD, IaC e a disseminação de boas práticas de SRE e monitoramento proativo. * Apoiar a capacitação técnica dos times. **Required technical and professional expertise** * Experiência com ServiceNow; * Conhecimento em Arquitetura de Observabilidade; * Vivência na definição e acompanhamento de SLIs (Service Level Indicators) e SLOs (Service Level Objectives); * Experiência com ferramentas de APM e monitoramento (Dynatrace, AppDynamics, Prometheus, Grafana, etc.); * Conhecimento em CI/CD; * Formação superior completa; * Disponibilidade para atuar em modelo híbrido em São Paulo. **Preferred technical and professional experience** * Desejável experiência em projetos bancários. IBM is committed to creating a diverse environment and is proud to be an equal-opportunity employer. All qualified applicants will receive consideration for employment without regard to race, color, religion, sex, gender, gender identity or expression, sexual orientation, national origin, caste, genetics, pregnancy, disability, neurodivergence, age, veteran status, or other characteristics. IBM is also committed to compliance with all fair employment practices regarding citizenship and immigration status.
Confirmar seu email: Enviar Email
Todos os Empregos de IBM