עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
Introduction
At IBM work is more than a job - it’s a calling: To build. To design. To code. To consult. To think along with clients and sell. To make markets. To invent. To collaborate. Not just to do something better, but to attempt things you’ve never thought possible. Are you ready to lead in this new era of technology and solve some of the world’s most challenging problems? If so, let’s talk.
Your Role And Responsibilities
If you’re a student excited about the intersection of large language models with speech and audio analysis—and want to contribute to research with both academic and industrial impact—this internship is for you.
Our team at IBM Research develops models, algorithms, and technologies that drive IBM products and advance the broader AI community. We publish papers, release open-source models, and file patents based on our work.
As An Intern, You’ll Tackle Real-world Problems Using Cutting-edge Deep Learning Methods To Advance The State Of The Art In Speech Understanding And Generation. You’ll Collaborate Closely With Researchers, Leverage Large-scale GPU Compute, And Focus On One Of The Following Areas
- Speech and Audio — Advancing recognition, analysis, and generation of natural speech and audio for more expressive, human-like interaction. Research spans generative and conversational AI, speech synthesis, and multimodal representation learning.
- Multimodal and Foundation Models — Exploring large-scale, unified models that jointly learn from text and audio. Topics include self-supervised learning, realistic data synthesis, expressive speech generation, and tokenization strategies.
This is a 3-month, full-time summer internship at our Haifa or Tel Aviv research sites (flexible).
Sample Of 2025 Publications By The Group
Granite Speech, ASRU 2025
ProsodyLM: Uncovering the Emerging Prosody Processing Capabilities in Speech Language Models, COLM 2025
Spoken question answering for visual queries, Interspeech 2025
Continuous Speech Synthesis using per-token Latent Diffusion, ASRU 2025
A Non-autoregressive Model for Joint STT and TTS, ICASSP 2025
Required Technical And Professional Expertise
- M.Sc. or Ph.D. student with knowledge in Machine Learning and Multimodal Large Language Models.
- Strong background using modern methods, deep knowledge of the recent literature, prior CV/ML/DL/LLMs publications are an advantage.
- Strong Python coding skills. Experience with Transformers and LLMs is an advantage.
- A team player with great social skills and willingness to collaborate.
Preferred Technical And Professional Experience
Publication/s at top-tier peer-reviewed conferences or journals.
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
שאלות ותשובות עבור משרת Multimodal AI - Speech- MSc and PHD-Summer internship 2026- Research Lab
התמחות Multimodal AI - Speech ב-IBM Research מתמקדת בפיתוח מודלים, אלגוריתמים וטכנולוגיות המשלבים מודלי שפה גדולים עם ניתוח דיבור ואודיו. תחומי המחקר כוללים קידום זיהוי, ניתוח ויצירת דיבור ואודיו טבעיים לאינטראקציה אנושית יותר, חקר מודלים מאוחדים בקנה מידה גדול שלומדים במשותף מטקסט ואודיו, למידה בפיקוח עצמי, סינתזת נתונים ריאליסטית, יצירת דיבור אקספרסיבי ואסטרטגיות טוקניזציה.
משרות נוספות מומלצות עבורך
-
Research Intern - Agentic Video Understanding
-
הרצליה
Apple
-
-
Research Intern — Agentic Video Understanding
-
הרצליה
Apple
-
-
Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab
-
גבעתיים
IBM
-
-
Cost-Efficient Inference Serving and Routing Optimization- MSc and PHD-Summer internship 2026- Research Lab
-
חיפה
IBM
-
-
AI Video Research Engineer Intern
-
תל אביב - יפו
Tether.io
-
-
AI Video Research Engineer Intern
-
תל אביב - יפו
Tether Operations Limited
-
12,000-18,000 ₪