jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חינם
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חינם
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

Senior Software Engineer- AI Datacenter Orchestration

DRIVENETS

DRIVENETS DRIVENETS

  • תל אביב - יפו
  • Indeed
Indeed

Senior Software Engineer- AI Datacenter Orchestration

DRIVENETS

DRIVENETS DRIVENETS

  • תל אביב - יפו
  • bag_icon מלאה
  • coins_icon 30,000-45,000 ₪ הערכה מבוססת AI ולא שכר שהתקבל מהמעסיק
    זוהי הערכת טווח שכר מבוססת AI ולא שכר שהתקבל מהמעסיק
  • Indeed
Indeed

Location: Tel Aviv

#Hybrid

DriveNets is a leader in high-scale disaggregated networking solutions. Founded in 2015, DriveNets modernizes the way service providers, cloud providers and hyperscalers build networks. Supporting the largest network in the world, more than half of AT&T’s backbone traffic is running on DriveNets’ Network Cloud open disaggregated architecture. Raising $587 million in three funding rounds, DriveNets is disrupting the networking market from high-scale architecture to AI platforms, and is bringing onboard the most talented people. We are seeking people that want to make an impact on the world’s leading communication networks and are experienced in networking architecture or AI infrastructure solutions.

Responsibilities and Duties

• Design and build the profiled network infrastructure that teams run high-performance LLM serving services on in production.

• Build the data-path and memory-fabric infrastructure that gives teams the primitives to implement KV cache strategies — paged attention, prefix caching, eviction policies — and hit their efficiency and latency targets.

• Provision and profile the network fabric and cluster infrastructure that inference frameworks (vLLM, TGI, TensorRT-LLM, Triton) are deployed on across GPU clusters.

• Build the scheduling and network infrastructure that exposes the throughput primitives teams need to implement batching strategies (continuous batching, dynamic batching) under SLA constraints.

• Build the compute and memory-bandwidth infrastructure profiles that give teams the headroom to evaluate and apply quantization techniques (GPTQ, AWQ, FP8, INT8) with clear production tradeoffs.

• Build network-level observability infrastructure — TTFT, TPOT, tokens/sec, GPU utilization, cache hit rates — that teams instrument their inference services against.

• Design and build the transport layer (SSE, gRPC, WebSocket) that teams use to expose real-time inference APIs.

• Build the storage and network infrastructure — sharding, format conversion, runtime configuration — that model teams use to move checkpoints to production endpoints.

Requirements:

Technical Skills

• 5+ years of backend engineering, with 2+ years specifically in ML inference systems.

• Deep understanding of transformer attention mechanics as they relate to KV cache design.

• Hands-on experience with at least one major inference engine (vLLM, TGI, TRT-LLM, Triton).

• Strong Python skills; ability to read and modify inference engine internals; C++/CUDA familiarity.

• Experience with paged/virtual KV cache, prefix caching, speculative decoding, or disaggregated prefill/decode.

• Production experience with GPU clusters (A100/H100/H200) and CUDA memory management.

• Experience with container orchestration (Kubernetes) and GPU scheduling.

• Strong fundamentals in building observable, production-grade microservices: health checks, structured logging, distributed tracing, metrics.

Soft Skills

• Strong cross-functional collaboration — ability to work effectively with model research and platform teams.

• Ownership mindset: comfortable driving production tradeoffs and making decisions under uncertainty.

• Clear technical communication: able to explain complex systems to both engineering and non-engineering stakeholders.

Nice to Have / Advantage

• Experience with tensor parallelism (TP), pipeline parallelism (PP), or multi-node inference.

• Contributions to open-source inference projects (vLLM, SGLang, etc.).

• Familiarity with attention variants: GQA, MLA, sliding window, MoE routing.

• Experience with NVIDIA NIM or Triton Inference Server deployment at scale.


במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

שאלות ותשובות עבור משרת Senior Software Engineer- AI Datacenter Orchestration

כמהנדס/ת תוכנה בכיר/ה בתחום תזמור מרכזי נתונים מבוססי AI ב-DRIVENETS, תהיה/תהיי אחראי/ת על תכנון ובניית תשתית רשת מותאמת אישית עבור שירותי LLM בעלי ביצועים גבוהים, פיתוח תשתית נתיבי נתונים וזיכרון עבור אסטרטגיות מטמון KV, הקצאה ופרופיל של תשתית רשת ואשכולות GPU, ובניית תשתית תזמון ורשת לחשיפת פרימיטיבי תפוקה. בנוסף, תעסוק/תעסקי בבניית תשתית נראות ברמת הרשת ותכנון שכבת התעבורה עבור ממשקי API של הסקת מסקנות בזמן אמת.

לתפקיד זה ב-DRIVENETS נדרשים 5+ שנות ניסיון בהנדסת Backend, מתוכן לפחות שנתיים במערכות הסקת מסקנות של למידת מכונה. כמו כן, נדרשת הבנה עמוקה במכניקת טרנספורמרים ביחס לתכנון מטמון KV, ניסיון מעשי עם מנוע הסקה מרכזי אחד לפחות (כגון vLLM, TGI, TRT-LLM, Triton), מיומנויות Python חזקות, והיכרות עם C++/CUDA. ניסיון עם אשכולות GPU (A100/H100/H200) וניהול זיכרון CUDA, וכן עם תזמור קונטיינרים (Kubernetes) ותזמון GPU, הם חיוניים.

DRIVENETS היא חברה מובילה בפתרונות רשת מפורקים בקנה מידה גדול, המחדשת את הדרך שבה ספקי שירות, ספקי ענן והיפר-סקיילרים בונים רשתות. החברה תומכת ברשת הגדולה בעולם, כאשר למעלה ממחצית מתעבורת הליבה של AT&T פועלת על ארכיטקטורת Network Cloud שלה. DRIVENETS גייסה 587 מיליון דולר ומחפשת אנשים מוכשרים שרוצים להשפיע על רשתות התקשורת המובילות בעולם, תוך התמקדות בארכיטקטורת רשת או פתרונות תשתית AI.

משרות נוספות מומלצות עבורך
  • רשימת משאלות

    Senior Software Engineer- AI Datacenter Orchestration

    • map_icon תל אביב - יפו
    DRIVENETS

    DRIVENETS

לכל המשרות של Senior Backend Engineer (AI/ML Infrastructure)

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם