jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חינם
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

Applied RL Scientist

Innodata Inc.

Innodata Inc. Innodata Inc.

  • תל אביב - יפו
  • LinkedIn
LinkedIn

Applied RL Scientist

Innodata Inc.

Innodata Inc. Innodata Inc.

  • תל אביב - יפו
  • bag_icon מלאה, עבודה מהבית
  • coins_icon 25,000-35,000 ₪ (הערכה מבוססת AI)
    זוהי הערכת טווח שכר מבוססת AI ולא פרסום של המעסיק
  • LinkedIn
LinkedIn


About the Job

Innodata's Frontier AI teams are pushing the boundaries of reinforcement learning applications—and RLVR (Reinforcement Learning with Verifiable Rewards) and RL Gyms in particular—to train, evaluate, and stress-test the world's most advanced AI models and agents. We're hiring an Applied RL Scientists to join our leading researchers, chief scientist, and VP for AI to design the algorithmic core of these systems, the implementation frameworks of RL environments, and to turn cutting edge research ideas into shipped pipelines on short timescales.

You will work side-by-side with our researcher team to design reward models, training objectives, data-generation strategies, and evaluation methodologies. You'll prototype them in code, run rigorous experiments, and collaborate with engineers to deploy what works into production. This is an applied research-heavy role for someone who can read a paper on Thursday and have a working implementation by Sunday.

What You'll Do

  • Help steer the algorithmic direction of our RL training environments, evaluation, and data-generation workflows.
  • Translate research ideas into working code—both internal prototypes and production-grade pipelines.
  • Design reward models, verifiers, and evaluation harnesses with defensible properties.
  • Run experiments, rigorously analyze results, and use findings to drive the next iteration.
  • Partner with engineers to operationalize the right algorithms at scale.
  • Stay current on the literature about RL, post-training, and evaluation, and bring in the most useful ideas quickly into production.

What You'll Bring

  • PhD (preferred) or MSc in Computer Science, Mathematics, Statistics, Machine Learning, or related fields.
  • Strong research background in reinforcement learning, ideally including exposure to RLHF, RLVR, DPO, or other post-training methods.
  • Hands-on experience implementing RL algorithms from scratch (PPO, GRPO, DPO, or similar).
  • Strong Python and PyTorch skills—comfortable writing custom training loops, not just using high-level wrappers.
  • Solid mathematical foundations: probability, statistics, optimization, linear algebra.
  • A track record of taking research from ideas to working code quickly.
  • Excellent English communication—you can explain a method clearly to engineers and a result clearly to partners.
  • Creativity and problem solving

Bonus Points

  • Publications at top ML venues (NeurIPS, ICML, ICLR, ACL, EMNLP).
  • Experience designing reward models, verifiers, or evaluation methodologies for LLMs.
  • Familiarity with distributed training infrastructure and large-scale experiments.
  • Open-source contributions to RL or LLM post-training libraries (TRL, OpenRLHF, verl, etc.).
  • Experience working closely with engineering teams to ship research into production.



במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

שאלות ותשובות עבור משרת Applied RL Scientist

ה-Applied RL Scientist ב-Innodata Inc. אחראי על דחיפת הגבולות של יישומי למידת חיזוק (RL), ובפרט RLVR ו-RL Gyms, כדי לאמן, להעריך ולבחון מודלי וסוכני AI מהמתקדמים בעולם. התפקיד כולל עיצוב הליבה האלגוריתמית של מערכות אלו, מסגרות הטמעה של סביבות RL, והפיכת רעיונות מחקריים חדשניים לפתרונות יישומיים במהירות.

לתפקיד Applied RL Scientist ב-Innodata Inc. נדרש תואר שלישי (מועדף) או שני במדעי המחשב, מתמטיקה, סטטיסטיקה, למידת מכונה או תחומים קרובים. המועמד צריך להביא רקע מחקרי חזק בלמידת חיזוק, ניסיון מעשי ביישום אלגוריתמי RL מאפס (כמו PPO, GRPO, DPO), מיומנויות חזקות ב-Python ו-PyTorch, ויכולת להפוך רעיונות מחקריים לקוד עובד במהירות. ידע במודלים של תגמול, מאמתים ומתודולוגיות הערכה עבור LLMs הוא יתרון.

ה-Applied RL Scientist ב-Innodata Inc. מוביל את הכיוון האלגוריתמי של סביבות אימון ה-RL, הערכה ותהליכי יצירת הנתונים. הוא מתרגם רעיונות מחקריים לקוד עובד, הן כאבות טיפוס פנימיים והן כפתרונות ברמת ייצור, ומעצב מודלי תגמול, מאמתים ורתימות הערכה בעלי תכונות מוגדרות. בנוסף, הוא מבצע ניסויים, מנתח תוצאות בקפדנות ומשתמש בממצאים כדי להניע את האיטרציה הבאה, תוך שיתוף פעולה עם מהנדסים ליישום אלגוריתמים בקנה מידה גדול.

לכל המשרות של Applied Research Scientist (Reinforcement Learning)

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם