עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לחפש לבד בין מאות מודעות – תנו ל-Jobify לנתח את קורות החיים שלכם ולהציג לכם רק הזדמנויות שבאמת שוות את הזמן שלכם מתוך מאגר המשרות הגדול בישראל.
השימוש חינם, ללא עלות וללא הגבלה.
Job Title
Site Reliability Engineer
Location
Israel. Hybrid or on-site preferred.
About GCS.AI
GCS.AI builds privacy-first computer vision video analytics systems designed to help keep public spaces safe, well-maintained and clean. We deploy our solution on-premises in our customers' data centers, and integrate it with existing cameras, VMS platforms, and customer systems.
Role Summary
Lead on-site deployment, integration, upgrades and troubleshooting of GCS.AI’s video analytics platform across customer's data centers. Own provisioning, upgrades and incident response on bare-metal, automate installation and observability, integrate with customer cameras, VMS and networks, and provide technical leadership during customer-facing engagements and troubleshooting.
Key Responsibilities
- Deploy, configure, integrate and troubleshoot our Kubernetes-based stack on bare-metal servers in customer data-centers
- Maintain and improve installation automation and observability to run reliably across production sites
- Collaborate with engineering and product teams to shape improvements
- Coordinate with customer administrators to configure network hardware and security controls
- Troubleshoot networking and streaming issues (routing, VLANs, firewalls, packet loss)
- Estimate hardware, storage and bandwidth requirements for new deployments
- Provide technical leadership during customer-facing engagements and incident response
Must-Have Required Experience
- 3+ years in one or more of: network engineering, DevOps, production infrastructure, systems integration, system reliability engineering, or similar
- 2+ years operating Kubernetes in production (on-prem or cloud), including upgrades and incident response, using Helm charts or similar tooling
- Strong TCP/IP fundamentals: OSI layers, routing, NAT, firewalls, VLANs, VPNs, DNS, ARP, BGP, TCP/UDP
- Strong Linux administration skills
- Strong troubleshooting and root-cause analysis
- Basic understanding of containers and runtimes (OCI, containerd, Docker)
- Observability fundamentals: metrics, logs, alerting and triage
- Basic Python for scripting and automation
- Excellent written and spoken English, comfortable in customer-facing communication. Hebrew native
- High ownership, autonomy, and strong self-management
Nice to Have
- GPU workloads on Kubernetes (NVIDIA drivers/runtime, device plugin, scheduling, performance tuning)
- Experience with CNIs
- Video streaming and CCTV experience: RTSP, bitrate planning, latency and packet loss troubleshooting, ONVIF
- WebRTC experience (ICE, STUN/TURN)
- Experience with LGTM stack (Loki, Grafana, Tempo, Mimir)
- SSO systems configuration
- Infrastructure-as-code experience (Terraform/OpenTofu)
- Bare-metal and virtualized provisioning experience (KVM, ESXi)
What We Offer
- Work with self-managed clusters in real-world deployments
- Professional growth in Kubernetes, networking, DevOps, and infrastructure automation
- Opportunity to solve complex technical challenges across diverse customer environments
- Direct impact on public safety and infrastructure maintenance
- Collaborative team with strong technical expertise
- Reasonable market salary
במקום לחפש לבד בין מאות מודעות – תנו ל-Jobify לנתח את קורות החיים שלכם ולהציג לכם רק הזדמנויות שבאמת שוות את הזמן שלכם מתוך מאגר המשרות הגדול בישראל.
השימוש חינם, ללא עלות וללא הגבלה.
שאלות ותשובות עבור משרת Site Reliability Engineer
מהנדס/ת אמינות אתר ב-GCS.Ai Technologies יוביל/תוביל את הפריסה, האינטגרציה, השדרוגים ופתרון התקלות של פלטפורמת ניתוח הווידאו של החברה במרכזי הנתונים של הלקוחות. התפקיד כולל גם אחריות על הקצאה, שדרוגים ותגובה לאירועים בסביבות Bare-Metal, אוטומציה של התקנות וניטור, ושילוב עם מצלמות, פלטפורמות VMS ומערכות לקוח קיימות.
משרות נוספות מומלצות עבורך
-
Senior Site Reliability Engineer (NetSec)
-
תל אביב - יפו
Palo Alto Networks
-
-
Senior Site Reliability Engineer (NetSec)
-
תל אביב - יפו
Palo Alto Networks
-
-
Site Reliability Engineer
-
תל אביב - יפו
Comply365
-
-
Site Reliability Engineer
-
תל אביב - יפו
OnHires
-
-
Site Reliability Engineer
-
תל אביב - יפו
Cato Networks
-
-
SRE
-
פתח תקווה
Glassbox
-