jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חינם
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

GenAI Engineer - Evaluation

Dream

Dream Dream

  • תל אביב - יפו
  • LinkedIn
LinkedIn

GenAI Engineer - Evaluation

Dream

Dream Dream

  • תל אביב - יפו
  • bag_icon היברידית
  • coins_icon 25,000-35,000 ₪ (הערכה מבוססת AI)
    זוהי הערכת טווח שכר מבוססת AI ולא פרסום של המעסיק
  • LinkedIn
LinkedIn


At Dream, we redefine cyber defense vision by combining AI and human expertise to create products that protect nations and critical infrastructure. This is more than a job; It’s a Dream job. Dream is where we tackle real-world challenges, redefine AI and security, and make the digital world safer. Let’s build something extraordinary together.

Dream's AI cybersecurity platform applies a new, out-of-the-ordinary, multi-layered approach, covering endless and evolving security challenges across the entire infrastructure of the most critical and sensitive networks. Central to our Dream's proprietary Cyber Language Models are innovative technologies that provide contextual intelligence for the future of cybersecurity.

At Dream, our talented team, driven by passion, expertise, and innovative minds, inspires us daily. We are not just dreamers, we are dream-makers.

The Dream Job:

In this role, you'll be responsible for designing and implementing evaluation, validation and optimization of GenAI systems. You will define, design and develop LLMs as judges to evaluate task and system outputs across multiple applications, create datasets for benchmarking and evaluation and help design robust and scalable evaluation pipelines for both onine and offline GenAI systems.

The Dream-Maker Responsibilities:

  • Design, develop and apply state-of-the-art techniques for evaluating and validating AI agents and/or workflows.
  • Develop and implement LLM-as-a-Judge (or similar) for different tasks and roles for GenAI systems and tools.
  • Design and implement evaluation pipelines and benchmark datasets for evaluating model quality, relevance and system consistency for various applications.
  • Optimize and maintain judge LLMs to evaluate outputs for different use cases such as chatbots, RAG systems, cybersecurity experts and investigators.
  • Define evaluation KPIs and metrics for both models, systems and tools.
  • Validate and optimize datasets for various use cases.
  • Ensure the reliability, efficiency, and scalability of evaluation tools and pipelines for both online and offline use cases.
  • Work closely with AI/ML engineers to make evaluations a part of the production pipelines of GenAI applications.
  • Collaborate with cross-functional teams including product, research and data science.
  • Stay up to date with the latest developments in AI, machine learning, focusing on LLMs, exploring how emerging technologies can be applied to improve our evaluation and validation pipelines.

The Dream Skill Set:

  • Advanced knowledge and experience in NLP and use of LLMs for GenAI applications in production at scale.
  • Strong experience in designing end-to-end R&D plans for GenAI including evaluation and validation lifecycle and benchmarking.
  • Strong proficiency in Python
  • Solid understanding of Data Science and Machine Learning lifecycle and best practices evaluating and validating AI systems at scale.
  • Excellent problem-solving abilities, coupled with a creative and strategic mindset.
  • Proven ability to work effectively in a team setting.

Advantages:

  • Experience with EDD (evaluation driven development) for GenAI applications.
  • Familiarity with cybersecurity applications of GenAI.
  • Advanced skills in performance optimization for high throughput systems.

Tech Stack:

Python, Langchain, Langgraph (or other agentic frameworks), Langfuse/LangSmith (or other observability and tracing tools), HuggingFace, Mlflow, MongoDB

Never Stop Dreaming...:

If you think this role doesn't fully match your skills but are eager to grow and break glass ceilings, we’d love to hear from you!


במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

שאלות ותשובות עבור משרת GenAI Engineer - Evaluation

מהנדס/ת GenAI – הערכה בחברת Dream אחראי/ת על תכנון ויישום הערכה, אימות ואופטימיזציה של מערכות GenAI. התפקיד כולל הגדרה ופיתוח של מודלי שפה גדולים (LLMs) כשופטים להערכת תפוקות משימות ומערכות, יצירת מערכי נתונים לבנצ'מרקינג והערכה, וסיוע בתכנון צינורות הערכה חזקים וניתנים להרחבה עבור מערכות GenAI מקוונות ולא מקוונות.

לתפקיד מהנדס/ת GenAI – הערכה בפלטפורמת אבטחת הסייבר של Dream נדרשים ידע וניסיון מתקדמים בעיבוד שפה טבעית (NLP) ושימוש ב-LLMs עבור יישומי GenAI בקנה מידה גדול. כמו כן, נדרש ניסיון חזק בתכנון תוכניות מחקר ופיתוח מקצה לקצה עבור GenAI, כולל מחזור חיי הערכה ואימות ובנצ'מרקינג, ושליטה חזקה ב-Python. הבנה מוצקה של מדעי הנתונים ומחזור חיי למידת מכונה, יחד עם יכולות פתרון בעיות מצוינות, חיוניים להצלחה בתפקיד זה.

מהנדס/ת GenAI – הערכה תורם/ת לפיתוח מודלי שפה קיברנטיים קנייניים ב-Dream על ידי עיצוב ויישום צינורות הערכה ומערכי נתונים לבנצ'מרקינג, המבטיחים את איכות המודל, הרלוונטיות ועקביות המערכת. התפקיד כולל אופטימיזציה ותחזוקה של LLMs שופטים להערכת תפוקות עבור מגוון רחב של מקרי שימוש, כגון צ'אטבוטים, מערכות RAG ומומחי אבטחת סייבר. עבודה צמודה עם מהנדסי AI/ML מבטיחה שההערכות יהפכו לחלק אינטגרלי מצינורות הייצור של יישומי GenAI, ובכך משפרת את האינטליגנציה ההקשרית של מודלי השפה הקיברנטיים של Dream.

משרות נוספות מומלצות עבורך
  • רשימת משאלות

    מהנדס.ת AI

    • map_icon פתח תקווה
    Mertens – Malam Team

    Mertens – Malam Team

  • רשימת משאלות

    Prompt Engineer (36410)

    • map_icon תל אביב - יפו
    מרטנס | Mertens – מקבוצת מלם תים

    מרטנס | Mertens – מקבוצת מלם תים

  • רשימת משאלות

    Artificial Intelligence Engineer Prompt Engineer

    • map_icon תל אביב - יפו
    Nogamy

    Nogamy

  • רשימת משאלות

    AI Implementation Specialist

    • map_icon תל אביב - יפו
    Tipli

    Tipli

  • רשימת משאלות

    Senior AI Engineer

    • map_icon תל אביב - יפו
    Vast DATA

    Vast DATA

  • רשימת משאלות

    AI Engineer

    • map_icon תל אביב - יפו
    Dialog

    Dialog

לכל המשרות של AI Engineer

הכשרות רלוונטיות

מכללת INT

מכללת INT

קורס דאטה סיינס / Data Science

מכללת INT

מכללת INT

קורס דאטה סיינס / Data Science

הטכניון -  מכון טכנולוגי לישראל

הטכניון - מכון טכנולוגי לישראל

Generative AI and LLM Hands On

  • ערב
  • clk_icon 7 חודשים
הטכניון -  מכון טכנולוגי לישראל

הטכניון - מכון טכנולוגי לישראל

Generative AI and LLM Hands On

  • ערב
  • clk_icon 7 חודשים

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם