jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לחפש לבד בין מאות מודעות – תנו ל-Jobify לנתח את קורות החיים שלכם ולהציג לכם רק הזדמנויות שבאמת שוות את הזמן שלכם מתוך מאגר המשרות הגדול בישראל.
השימוש חינם, ללא עלות וללא הגבלה.

הגישו קו”ח דרך Jobify

Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab

IBM

הגישו קו”ח דרך Jobify

IBM IBM

  • גבעתיים
  • LinkedIn
LinkedIn

Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab

IBM

הגישו קו”ח דרך Jobify

IBM IBM

  • גבעתיים
  • LinkedIn
LinkedIn


Introduction

At IBM work is more than a job - it’s a calling: To build. To design. To code. To consult. To think along with clients and sell. To make markets. To invent. To collaborate. Not just to do something better, but to attempt things you’ve never thought possible. Are you ready to lead in this new era of technology and solve some of the world’s most challenging problems? If so, let’s talk.

Your Role And Responsibilities

We are looking for a highly motivated PhD or MSc student to join our team for a summer internship focused on cost-efficient serving of large-scale AI inference workloads.

The internship will explore advanced routing strategies and KV-cache–aware optimizations in distributed inference systems, with an emphasis on improving performance, scalability, and GPU cost efficiency.

What you will work on

  • Designing and evaluating routing algorithms to optimize inference latency, throughput, and cost
  • Investigating KV cache management strategies for large-scale, distributed inference serving
  • Prototyping, benchmarking, and analyzing inference optimization techniques
  • Working with modern inference frameworks and real production-like workloads

Why join us?

This internship offers a unique opportunity to work at the intersection of AI systems and distributed infrastructure, with real-world impact on scalable, cost-efficient inference serving used in production environments.

Required Technical And Professional Expertise

  • MSc or PhD student in Computer Science, Machine Learning Systems, or a related field
  • Strong background or interest in distributed systems, systems research, or ML infrastructure
  • Strong programming skills (Python, Go, or similar)
  • Hands-on experience or familiarity with vLLM (architecture, KV cache behavior, scheduling, or extensions)
  • Interest in AI infrastructure, performance optimization, and cost efficiency
  • Ability to work independently while collaborating effectively within a research and engineering team

Please include your grade sheet with your application.

Preferred Technical And Professional Experience

  • Experience with Kubernetes (K8s) and cloud-native systems
  • Familiarity with inference serving stacks, networking, or GPU-based systems
  • Experience with benchmarking, profiling, or performance analysis


במקום לחפש לבד בין מאות מודעות – תנו ל-Jobify לנתח את קורות החיים שלכם ולהציג לכם רק הזדמנויות שבאמת שוות את הזמן שלכם מתוך מאגר המשרות הגדול בישראל.
השימוש חינם, ללא עלות וללא הגבלה.

הגישו קו”ח דרך Jobify

שאלות ותשובות עבור משרת Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab

התמחות הקיץ ב-IBM מתמקדת באופטימיזציה של הגשת הסקות AI בקנה מידה גדול באופן חסכוני. המחקר יכלול אסטרטגיות ניתוב מתקדמות ואופטימיזציות מודעות ל-KV-cache במערכות הסקה מבוזרות, במטרה לשפר ביצועים, מדרגיות ויעילות עלויות של GPU.

לצורך התמחות זו, IBM מחפשת סטודנטים לתואר שני או דוקטורט במדעי המחשב, מערכות למידת מכונה או תחום קרוב, עם רקע חזק במערכות מבוזרות או תשתית ML. נדרשות גם כישורי תכנות חזקים (Python, Go או דומיהן) וניסיון או היכרות עם vLLM.

התמחות זו מציעה הזדמנות ייחודית לעבוד בצומת של מערכות AI ותשתית מבוזרת, עם השפעה ממשית על הגשת הסקות AI מדרגית וחסכונית המשמשת בסביבות ייצור. זוהי הזדמנות לעבוד עם מסגרות הסקה מודרניות ועומסי עבודה דמויי ייצור אמיתיים.

משרות נוספות מומלצות עבורך
  • רשימת משאלות

    AI for AI Platforms- MSc and PHD-Summer internship 2026- Research Lab

    • map_icon חיפה
    IBM

    IBM

  • רשימת משאלות

    AI for AI Platforms- MSc and PHD-Summer internship 2026- Research Lab

    • map_icon גבעתיים
    IBM

    IBM

  • רשימת משאלות

    Computer Vision Research Student

    • map_icon רמת גן
    OriginAI

    OriginAI

  • רשימת משאלות

    Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab

    • map_icon חיפה
    IBM

    IBM

  • רשימת משאלות

    Foundation Models for Decision Making - Internship

    • map_icon יקנעם עילית
    Elbit Systems

    Elbit Systems

  • רשימת משאלות

    AI Research Intern

    • map_icon תל אביב - יפו
    Cisco

    Cisco

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם