עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
This is a hands-on role for someone who thrives in fast-paced environments, enjoys troubleshooting complex issues, and is passionate about reducing downtime and improving incident response processes.
Responsibilities:
Real-time monitoring of production systems to detect and respond to incidents.
Analyze and triage alerts, identifying root causes and escalating when necessary.
Manage live incidents, ensuring clear communication and timely resolution.
Document and improve incident response processes, including updating runbooks and playbooks.
Collaborate with SREs and developers to drive post-mortem analysis and implement long-term reliability improvements.
Reduce alert fatigue by tuning monitoring systems and ensuring alerts are actionable.
Participate in on-call rotations, ensuring 24/7 incident response coverage.
Proactively suggest improvements to monitoring, alerting, and automation strategies.
Requirements:
2+ years of experience in a NOC, Incident Management, or technical support role.
Experience with monitoring tools (Grafana, Prometheus, ELK, Datadog, New Relic, etc.).
Strong troubleshooting skills, with a structured approach to problem resolution.
Ability to analyze logs and metrics to identify root causes of incidents.
Excellent communication skills, with the ability to coordinate across teams.
Familiarity with cloud environments (AWS, Azure, GCP) and modern infrastructure concepts.
Ability to work under pressure, responding to incidents in a high-scale production environment.
Bonus Points:
Experience with incident automation tools and self-healing mechanisms.
Scripting skills (Bash, Python) to automate tasks and improve monitoring.
Familiarity with on-call management tools like PagerDuty or Opsgenie.
Understanding of SRE principles and site reliability best practices.
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
משרות נוספות מומלצות עבורך
-
דרו//ה ראש צוות שליטה ובקרה (שו״ב) לארגון מוביל
-
תל אביב - יפו
עידור מחשבים בע"מ
-
-
דרו //ה ראש צוות שליטה ובקרה (שוב) לארגון מוביל
-
הרצליה
עידור מחשבים בע"מ
-
-
מנהל/ת בקרה ותפעול דאטה סנטר
-
תל אביב - יפו
אוניברסיטת תל אביב
-
-
מנהל/ת בקרה ותפעול דאטה סנטר
-
תל אביב - יפו
אוניברסיטת תל אביב
-
-
דרוש/ה ראש צוות שליטה ובקרה
-
רמת גן
matrix (בנקאות)
-
-
מנהל/ת תחום שליטה ובקרה
-
רמת גן
QPOINT Technologies
-