jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חינם
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

Senior Software Engineer (ML), Data Plane

Annapurna Labs Ltd.

Annapurna Labs Ltd. Annapurna Labs Ltd.

  • תל אביב - יפו
  • Indeed
Indeed

Senior Software Engineer (ML), Data Plane

Annapurna Labs Ltd.

Annapurna Labs Ltd. Annapurna Labs Ltd.

  • תל אביב - יפו
  • bag_icon מלאה
  • coins_icon 30,000-50,000 ₪ (הערכה מבוססת AI)
    זוהי הערכת טווח שכר מבוססת AI ולא פרסום של המעסיק
  • Indeed
Indeed

DESCRIPTION

The MLIL DataPlane team is looking for a Senior Software Development Engineer to own the design and implementation of our inference data plane. We build the software that makes large models run efficiently on custom hardware - spanning model execution, memory management, data movement, and serving integration.
Our work covers the full inference path: integrating serving engines with custom hardware, developing high-performance compute kernels, enabling efficient data movement, and driving models from early validation through production. We operate at frontier scale with large distributed models.
This is a ground-up effort with rapidly evolving hardware and software. We need a senior IC who can write and optimize low-level code for custom hardware, validate model architectures end-to-end, build test and profiling infrastructure, and drive performance across the stack.

Key job responsibilities
- Develop and optimize compute kernels for a custom ML accelerator architecture, targeting production-level performance for large language model inference.
- Implement and validate LLM architectures (decoder-only, mixture-of-experts) end-to-end - from PyTorch model definition through distributed execution on custom hardware.
- Integrate custom accelerator backends into open-source ML serving frameworks (vLLM, PyTorch), including scheduler extensions, memory management, and model parallelism.
- Build and maintain test infrastructure for model correctness validation across CPU, GPU, simulator, and hardware targets.
- Profile and optimize inference workloads - identify bottlenecks, instrument critical paths, and drive latency and throughput improvements from simulation through hardware bringup.
- Own features end-to-end: from design through implementation, testing, and integration into the broader software stack.
- Contribute to CI/CD pipelines that gate model and kernel changes on correctness and performance regressions.
- Mentor engineers, drive design reviews, and raise the engineering bar across the team.

BASIC QUALIFICATIONS

- Bachelor's degree in computer science or equivalent
- 7+ years of full software development life cycle, including coding standards, code reviews, source control management, build processes, testing, and operations experience
- Knowledge of Machine Learning and LLM fundamentals, including transformer architecture, training/inference lifecycles, and optimization techniques
- Knowledge of computer architecture, operating systems, and parallel computing
- Strong proficiency in C/C++
- Strong Linux systems knowledge
- Experience developing compute kernels for GPUs, DSPs, or custom accelerators
- Proven track record of owning and delivering complex software features end-to-end

PREFERRED QUALIFICATIONS

- Knowledge of ML frameworks including JAX, PyTorch, vLLM, SGLang, Dynamo, TorchXLA, and TensorRT
- Experience in developing and deploying LLMs in production on GPUs, Neuron, TPU or other AI acceleration hardware, or experience with CUDA kernels or ML/low-level kernels
- Familiarity with speculative decoding, KV cache optimization, or other LLM serving optimizations
- Experience with distributed systems - collective communication, RDMA, or high-speed interconnect programming
- Experience with hardware simulation environments and model validation workflows
- Demonstrated early adopter of AI-assisted development tools - uses LLMs or code-generation agents as part of daily workflow

Our inclusive culture empowers Amazonians to deliver the best results for our customers. If you have a disability and need a workplace accommodation or adjustment during the application and hiring process, including support for the interview or onboarding process, please visit https://amazon.jobs/content/en/how-we-hire/accommodations for more information. If the country/region you’re applying in isn’t listed, please contact your Recruiting Partner.


במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

שאלות ותשובות עבור משרת Senior Software Engineer (ML), Data Plane

מהנדס תוכנה בכיר (ML) ב-Annapurna Labs Ltd. בתחום ה-Data Plane אחראי על תכנון ויישום של מישור נתוני ההסקה (inference data plane). התפקיד כולל פיתוח תוכנה המאפשרת למודלים גדולים לרוץ ביעילות על חומרה מותאמת אישית, תוך התמקדות בביצוע מודלים, ניהול זיכרון, העברת נתונים ושילוב שירותים. העבודה מכסה את כל נתיב ההסקה, משילוב מנועי שירות עם חומרה מותאמת אישית ועד פיתוח ליבות חישוב בעלות ביצועים גבוהים.

לתפקיד Senior Software Engineer (ML), Data Plane ב-Annapurna Labs נדרשים כישורים כמו תואר ראשון במדעי המחשב או מקביל, 7+ שנות ניסיון בפיתוח תוכנה מלא, ידע בלמידת מכונה ויסודות LLM (כולל ארכיטקטורת טרנספורמרים), ידע בארכיטקטורת מחשבים ומערכות הפעלה, שליטה חזקה ב-C/C++ ו-Linux, וניסיון בפיתוח ליבות חישוב עבור GPUs, DSPs או מאיצים מותאמים אישית.

מהנדס תוכנה בכיר (ML) ב-Annapurna Labs Ltd. תורם לביצועי מודלים גדולים על ידי פיתוח ואופטימיזציה של ליבות חישוב עבור ארכיטקטורת מאיץ ML מותאמת אישית, יישום ואימות ארכיטקטורות LLM מקצה לקצה, שילוב מאיצים מותאמים אישית במסגרות שירות ML בקוד פתוח, בניית ותחזוקת תשתית בדיקות, ופרופיל ואופטימיזציה של עומסי עבודה של הסקה. כל אלה נועדו לזהות צווארי בקבוק ולשפר את זמן ההשהיה והתפוקה.

משרות נוספות מומלצות עבורך
  • רשימת משאלות

    Senior Software Engineer (ML), Data Plane

    • map_icon תל אביב - יפו
    Amazon Web Services (AWS)

    Amazon Web Services (AWS)

לכל המשרות של Senior Machine Learning Software Engineer

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם