Mexico, MEX
15 hours ago
Ssr Site Reliability Engineer
Ssr Site Reliability Engineer Enviar candidatura ahora » **Fecha:** 7 abr 2026 **Ubicación:** Mexico, CMX, MX, 11000 **Empresa:** Scotiabank **ID de la solicitud:** 257231 **Programa de Referido de Empleados – Probable Pago:** $0,00 Estamos comprometidos en continuar invirtiendo en nuestros empleados y ayudarte a continuar desarrollando tu línea de carrera en Scotiabank. **_Propósito_** El Ingeniero de Site Reliability (SRE) tiene como propósito garantizar la **disponibilidad, confiabilidad, escalabilidad y eficiencia operativa** de los sistemas y servicios críticos de la organización, combinando prácticas de ingeniería de software con operaciones. El SRE trabaja en **estrecha colaboración** con los equipos de **desarrollo, operaciones y producto** para implementar y fortalecer prácticas de **observabilidad** , **gestión de incidentes** , **respuesta ante fallos** , **automatización** y **mejora continua** , asegurando que los servicios cumplan con los **acuerdos de nivel de servicio (SLA/SLO)** establecidos y mantengan una **experiencia de usuario óptima** . Asimismo, se encarga de **detectar fallas en tiempo real** , liderar la **respuesta técnica inicial** , **automatizar tareas repetitivas** , **reducir el MTTR** y proporcionar **análisis basados en datos** para prevenir incidentes futuros y mejorar continuamente la confiabilidad del entorno productivo. **_Responsabilidades:_** **Disponibilidad y confiabilidad de servicios** + Diseñar, implementar y mantener **sistemas resilientes** que cumplan con **SLO/SLA** . + Asegurar la **operación 7x24** y la continuidad del servicio respetando **error budgets** . **Observabilidad y análisis (end‑to‑end)** + Implementar y mantener **observabilidad** (métricas, logs, trazas) y **alertas accionables** . + Administrar **dashboards** y reglas de alerta en la plataforma de monitoreo utilizada. + Definir, medir y monitorear **SLI/SLO** por servicio. + Analizar **tendencias y degradaciones** con datos (queries de métricas, logs y trazas). **Gestión de incidentes y postmortems** + Actuar como **primer nivel técnico especializado** : detección y **diagnóstico inicial** . **Coordinar la escalación** y apoyar la **resolución** durante incidentes **P1/P2** . + Documentar y dar seguimiento a **postmortems/RCA** y planes de acción. + Reducir **MTTR** y prevenir **reincidentes** . **Confiabilidad, automatización y mejora continua** + Aplicar prácticas SRE ( **toil reduction, automatización, release readiness, error budgets** ). **Automatizar** tareas operativas (scripts, pipelines CI/CD, remedios). + Identificar y ejecutar **optimización** de arquitectura, rendimiento y costos. **Gestión de capacidad y escalabilidad** + Analizar **tendencias de uso y crecimiento** para anticipar necesidades de infraestructura. + Planificar y validar **escalabilidad** y **performance** de los servicios. **Colaboración transversal** + Colaborar con **Desarrollo, QA, Seguridad, Infraestructura y Producto** desde el diseño. + Asegurar que los **nuevos servicios** cumplan estándares de **observabilidad** , **mantenibilidad** y **confiabilidad** antes del go‑live. **Seguridad y cumplimiento** + Asegurar cumplimiento de **políticas de seguridad, privacidad y normativas** aplicables. + Colaborar en **controles, evidencias y auditorías** conforme a marcos internos. **Documentación técnica y cultura SRE** + Mantener **documentación** clara y actualizada (arquitectura, procesos, runbooks, SLI/SLO, RCA). + **Promover principios SRE** y buenas prácticas dentro de los equipos relacionados. **_Relaciones jerárquicas (solo nombres de puestos)Gerente principal:_** **_(incluir al gerente secundario si es pertinente)_** + Sub Director Service Reliability Engineering (SRE) **_Subordinados directos:_** n/a **_Subordinados compartidos (línea continua o punteada, según sea el caso):_** + n/a + Gestión de sistemas de alto volumen transaccional en operación 7x24. + Responsabilidad sobre la salud y disponibilidad del ecosistema productivo. + Generación de reportes ejecutivos de disponibilidad y desempeño. + Colaboración con equipos de TI locales y globales. + Mejora del proceso on-call. + Comprende la cultura de riesgo del Banco y cómo debe considerarse el apetito de riesgo en las actividades y decisiones diarias. + Garantiza el cumplimiento de los controles operativos y regulatorios aplicables. + Contribuye a la reducción del riesgo operativo, regulatorio, de lavado de dinero, financiamiento al terrorismo y riesgo de conducta. **_Educación / Experiencia / Otra información (incluya solo aquellos que son específicos a la función)_** + Título universitario en Ingeniería en Sistemas, Computación, Telecomunicaciones o afín. + Nivel de inglés intermedio‑alto (oral y escrito). + **5+ años** de experiencia en entornos productivos de **alta disponibilidad** y alto volumen transaccional (operación 7x24). + **3+ años** en soporte a producción o roles relacionados con confiabilidad, operación o monitoreo. + **4+ años** de experiencia en ingeniería de nube ( **AWS, GCP, Azure** ) o funciones equivalentes. + Experiencia en diseño, implementación y mantenimiento de **SLI/SLO** y prácticas SRE. + Experiencia con **microservicios** , cargas de trabajo basadas en contenedores y funciones. + Experiencia en **diseño de arquitecturas resilientes** , escalables y seguras. + Participación en **gestión de incidentes complejos** , diagnósticos detallados y análisis de causa raíz. + Capacidad probada para identificar proactivamente problemas, cuellos de botella y oportunidades de mejora. En Scotiabank, valoramos las habilidades y experiencias únicas que cada persona aporta al banco y nos comprometemos a crear y mantener un entorno inclusivo y accesible para todos. Todos/as los/las empleados deben cumplir con las políticas, normas, códigos y directrices del banco relacionadas con la no discriminación y las adaptaciones en el lugar de trabajo.Si necesitas algún tipo de adaptación en temas de accesibilidad durante el proceso, indícalo a nuestro equipo de Atracción de Talento**Scotiabank es una empresa incluyente, que respeta la diversidad y no hace ningún tipo de discriminación****Bajo ninguna circunstancia solicita pruebas de embarazo, ni de VIH**Agradecemos tu interés. Sin embargo, únicamente las personas seleccionadas para entrevista serán contactadas Ubicación(s): México : Ciudad de México : Cuauhtémoc Scotiabank es un banco líder en las Américas. Inspirándonos en nuestro propósito corporativo, “por nuestro futuro”, ayudamos a nuestros clientes, sus familias y sus comunidades a lograr el éxito a través de una completa gama de asesoría, productos y servicios en los sectores de banca personal y comercial, gestión patrimonial, banca privada, corporativa y de inversión, y mercados de capital. En Scotiabank, valoramos las habilidades y experiencias únicas que cada persona aporta al Banco y nos hemos comprometido a crear y mantener un entorno inclusivo y accesible para todos. Si necesitas algún tipo de adaptación (como, por ejemplo, un lugar accesible para la entrevista, documentos en formato alternativo, un intérprete en lengua de señas o tecnología de asistencia, entre otras cosas) durante el proceso de reclutamiento y selección, indícalo a nuestro equipo de Reclutamiento. Si necesitas apoyo técnico,haz clic aquí (https://www.scotiabank.com/careers/en/careers/technical-support-for-applicants.html) . Los candidatos deben postularse directamente en línea si desean ser tomados en cuenta para este puesto. Agradecemos a todos los candidatos por su interés en esta oportunidad profesional en Scotiabank, pero solo nos comunicaremos con aquellos que hayan sido seleccionados para una entrevista.
Confirmar seu email: Enviar Email