עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
Senior Software Engineer / Architect – AI Inference Storage
Position Overview
We are looking for an experienced senior developer to design and build high-performance storage & networking systems optimized for AI inference workloads, particularly large language models (LLMs). This role involves developing scalable, GPU-accelerated solutions integrated with storage and network infrastructure that integrates tightly with modern AI inference frameworks.
Key Responsibilities
- Build RDMA data paths (RoCE/IB/iWARP) and integrate with the RDMA software stack.
- Implement GPU direct storage pipelines (NVIDIA GPUDirect, NIXL, future GPU-access technologies).
- Design and operate core components of a stateful distributed system (consensus, recovery, failover).
- Write Rust for high-performance components and Python for automation / AI integration.
- Advanced method in Linux system programming (async I/O, memory management, kernel interfaces).
- Prototype → production: own the path from design to real deployments.
- Mentor engineers and set strong coding and design standards.
Required Qualifications
- Deep experience with RDMA protocols and software stack internals.
- Proven work with GPU direct storage / GPUDirect / NIXL or similar direct GPU I/O.
- Strong Rust and Python development skills.
- Track record in distributed systems (stateful, fault tolerant, horizontally scalable).
- Advanced Linux systems programming knowledge.
Way to stand out
- Kubernetes for deploying and scaling stateful storage.
- Linux kernel programming (drivers, block layer, networking stack).
- Familiarity with AI frameworks (PyTorch, vLLM, TensorRT, Triton).
- Performance profiling, benchmarking at scale.
- Contributions to open-source projects.
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
שאלות ותשובות עבור משרת Senior Software Engineer / Architect – AI Inference Storage
התפקיד כולל פיתוח מערכות אחסון ורשתות בעלות ביצועים גבוהים המותאמות לעומסי עבודה של הסקות AI, במיוחד עבור מודלי שפה גדולים (LLMs). זה כולל בניית נתיבי נתונים של RDMA, הטמעת צינורות אחסון ישירים ל-GPU, תכנון רכיבי ליבה של מערכת מבוזרת, וכתיבת קוד ב-Rust וב-Python.
משרות נוספות מומלצות עבורך
-
Software Architect
-
פתח תקווה
Cellebrite
-
-
Senior Software Architect, AI Network
-
רעננה
NVIDIA
-
-
Senior Software Architect, AI Network
-
תל אביב - יפו
NVIDIA
-
-
Senior Software Architect, AI Network
-
תל אביב - יפו
NVIDIA AI
-
-
Senior Software Architect, AI Network
-
תל אביב - יפו
NVIDIA
-
-
Senior Software Architect
-
רחובות
Nisha Group - קבוצת נישה
-