Garantizar la disponibilidad, confiabilidad y escalabilidad de las aplicaciones y servicios en la nube, mediante la implementación de las mejores prácticas. Este rol busca optimizar el rendimiento del sistema, prevenir fallos y automatizar tareas, contribuyendo al éxito de los productos y servicios tecnológicos de la empresa.
Principales Responsabilidades :
Diseñar y gestionar sistemas de monitorización y alertas (e.g., Dynatrace, Prometheus, Grafana) para garantizar el desempeño continuo de los servicios.
Automatizar procesos operativos mediante herramientas como Terraform, Ansible y scripts personalizados.
Analizar métricas de rendimiento y fiabilidad, proponiendo mejoras en sistemas y procesos.
Implementar estrategias de gestión de incidentes para minimizar el impacto y garantizar la recuperación rápida.
Monitorear y observar la fiabilidad del software en producción. Asi como también resolver problemas en el software.
Gestionar y planificar la capacidad de software en base a la demanda existente.
Colaborar con equipos de desarrollo para mejorar la calidad y estabilidad de los despliegues.
Built at: 2025-03-19T15:47:22.044Z