עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
In this role, you will be responsible for:
Drive incident response and post-mortem processes, fostering a culture of continuous improvement.
Design, build and improve internal tools and automation software to make maintaining production services easier and safer.
Lead reliability-focused practices such as SLO (Service Level Objective) design and implementation, Failure Analysis, Load and Capacity Planning, Service Reviews, Architecture Designs, Incident Postmortems, and others.
Participate in the on-call rotation, providing expertise and support during critical system incidents and ensuring timely resolution.
Minimum 5 years of Software Engineering experience with .Net, NodeJs or other object-oriented languages.
Knowledge of architecture and application design experience.
Excellent troubleshooting and debugging skills.
Excellent verbal and written communication skills in English.
Basic knowledge of AWS or other cloud platforms on the infrastructure level
Preferred:
Experience with building AzureDevops CI/CD pipelines
Experience working on large-scale, high-traffic platforms.
Distributed monitoring experience with logging, metrics and tracing using OpenTelemetry and Prometheus.
Additional scripting languages: bash, powershell, python
Previous experience working as SRE
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.