jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חדש
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

הגשת מועמדות

Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Resea

חברה בתחום הייטק / חומרה / תוכנה / סייבר

הגשת מועמדות

חברה בתחום הייטק / חומרה / תוכנה / סייבר

  • מספר מקומות
  • allJobs
allJobs

Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Resea

חברה בתחום הייטק / חומרה / תוכנה / סייבר

הגשת מועמדות

חברה בתחום הייטק / חומרה / תוכנה / סייבר

  • מספר מקומות
  • bag_icon חלקית
  • coins_icon 12,000-18,000 ₪ (הערכה מבוססת AI)
    זוהי הערכת טווח שכר מבוססת AI ולא פרסום של המעסיק
  • allJobs
allJobs

We are looking for a highly motivated PhD or MSc student to join our team for a summer internship focused on cost-efficient serving of large-scale AI inference workloads.The internship will explore advanced routing strategies and KV-cache-aware optimizations in distributed inference systems, with an emphasis on improving performance, scalability, and GPU cost efficiency.
What you will work on
Designing and evaluating routing algorithms to optimize inference latency, throughput, and cost
Investigating KV cache management strategies for large-scale, distributed inference serving
Prototyping, benchmarking, and analyzing inference optimization techniques
Working with modern inference frameworks and real production-like workloads
Why join us?
This internship offers a unique opportunity to work at the intersection of AI systems and distributed infrastructure, with real-world impact on scalable, cost-efficient inference serving used in production environments.
Requirements:
Bachelor's Degree
Required technical and professional expertise
MSc or PhD student in Computer Science, Machine Learning Systems, or a related field
Strong background or interest in distributed systems, systems research, or ML infrastructure
Strong programming skills (Python, Go, or similar)
Hands-on experience or familiarity with vLLM (architecture, KV cache behavior, scheduling, or extensions)
Interest in AI infrastructure, performance optimization, and cost efficiency
Ability to work independently while collaborating effectively within a research and engineering team
Please include your grade sheet with your application.
Preferred technical and professional experience
Experience with Kubernetes (K8s) and cloud-native systems
Familiarity with inference serving stacks, networking, or GPU-based systems
Experience with benchmarking, profiling, or performance analysis
This position is open to all candidates.


במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

הגשת מועמדות
משרות נוספות מומלצות עבורך
  • רשימת משאלות

    Research Intern - Agentic Video Understanding

    • map_icon הרצליה
    Apple

    Apple

  • רשימת משאלות

    Research Intern — Agentic Video Understanding

    • map_icon הרצליה
    Apple

    Apple

  • רשימת משאלות

    Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab

    • map_icon גבעתיים
    IBM

    IBM

  • רשימת משאלות

    Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab

    • map_icon חיפה
    IBM

    IBM

  • רשימת משאלות

    AI Video Research Engineer Intern

    • map_icon תל אביב - יפו
    Tether.io

    Tether.io

  • רשימת משאלות

    AI Video Research Engineer Intern

    • map_icon תל אביב - יפו
    Tether Operations Limited

    Tether Operations Limited

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם