עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
Description:
monday.com is looking for a Reliability Engineer to join our Reliability team. This role will be integral in ensuring the robustness and dependability of our platform, impacting millions of users globally.
About The Role:
- Maintain a comprehensive understanding of our service architecture and its dependencies.
- Identify and mitigate risks associated with tightly coupled services and complex interconnections.
- Lead service re-architecture initiatives to improve reliability and scalability.
- Review new services and ensure they meet our reliability standards.
- Advocate for Chaos Engineering, collaborate with R&D teams, build tools/envs, and improve system resilience
- Manage the full lifecycle of reliability tools and services, adhering to the comprehensive architectural guidelines
- Collaborate with teams to define and monitor Service Level Indicators (SLIs) and Service Level Objectives (SLOs) that align with business goals and user expectations
- Our Stack: Kubernetes, Datadog, Chaos Mesh, AWS, Terraform, CDKTF
Requirements:
- Proven k8s and Linux admin/internals experience.
- Proven experience with microservice architectures and reliability engineering.
- Deep understanding of reliability concepts (eg, SLOs, SLIs, and service interconnections).
- Strong background in incident response and resilience efforts.
- Ability to collaborate across teams to drive reliability improvements.
- (Nice-to-have): Prior knowledge with chaos engineering.
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
שאלות ותשובות עבור משרת Reliability Engineer
מהנדס אמינות ב-monday.com אחראי להבטיח את החוסן והאמינות של הפלטפורמה, המשפיעה על מיליוני משתמשים ברחבי העולם. התפקיד כולל הבנה מעמיקה של ארכיטקטורת השירות, זיהוי והפחתת סיכונים, הובלת יוזמות ארכיטקטורה מחדש לשיפור אמינות ויכולת הרחבה, וכן סקירת שירותים חדשים כדי לוודא שהם עומדים בסטנדרטים של אמינות.
משרות נוספות מומלצות עבורך
-
Site Reliability Engineer (SRE)
-
תל אביב - יפו
Wiz
-
-
Senior Site Reliability Engineer
-
תל אביב - יפו
Viz.ai
-
-
MATRIX - מהנדס/ת SRE
-
תל אביב - יפו
MATRIX
-
-
Site Reliability Engineering (SRE)
-
תל אביב - יפו
Riskified
-
-
Site Reliability Engineer
-
תל אביב - יפו
NetNut.io
-
-
Senior HPC Site Reliability Engineer
-
תל אביב - יפו
NVIDIA
-