jobify_logo ×
  • מִשׁתַמֵשׁ
  • התחברות/הרשמה
  • עמוד הבית
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות
קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service work_office המקום
jobify_logo
  • מי אנחנו
  • מעסיקים מובילים
  • פרסום משרה חינם
  • צרו קשר
דילוג לתוכן

עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!

במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

ML Data Engineer

Check Point Software

Check Point Software Check Point Software

  • תל אביב - יפו
  • LinkedIn
LinkedIn

ML Data Engineer

Check Point Software

Check Point Software Check Point Software

  • תל אביב - יפו
  • bag_icon מלאה
  • coins_icon 22,000-32,000 ₪ (הערכה מבוססת AI)
    זוהי הערכת טווח שכר מבוססת AI ולא פרסום של המעסיק
  • LinkedIn
LinkedIn


Why Join Us?

Join Check Point’s AI research group, a cross-functional team of ML engineers, researchers and security experts building the next generation of AI-powered security capabilities. Our mission is to leverage large language models to understand code, configuration, and human language at scale, and to turn this understanding into security AI capabilities that will drive Check Point’s future security solutions.

We foster a hands-on, research-driven culture where you’ll work with large-scale data, modern ML infrastructure, and a global product footprint that impacts over 100,000 organizations worldwide.

Key Responsibilities

Your Impact & Responsibilities

As a Data Engineer – AI Technologies, you will be responsible for building and operating the data foundation that enables our LLM and ML research: from ingestion and augmentation, through labeling and quality control, to efficient data delivery for training and evaluation.

You Will

  • Own data pipelines for LLM training and evaluation Design, build and maintain scalable pipelines to ingest, transform and serve large-scale text, log, code and semi-structured data from multiple products and internal systems.
  • Drive data augmentation and synthetic data generation Implement and operate pipelines for data augmentation (e.g., prompt-based generation, paraphrasing, negative sampling, multi-positive pairs) in close collaboration with ML Research Engineers.
  • Build tagging, labeling and annotation workflows Support human-in-the-loop labeling, active learning loops and semi-automated tagging. Work with domain experts to implement tools, schemas and processes for consistent, high-quality annotations.
  • Ensure data quality, observability and governance Define and monitor data quality checks (coverage, drift, anomalies, duplicates, PII), manage dataset versions, and maintain clear documentation and lineage for training and evaluation datasets.
  • Optimize training data flows for efficiency and cost Design storage layouts and access patterns that reduce training time and cost (e.g., sharding, caching, streaming). Work with ML engineers to make sure the right data arrives at the right place, in the right format.
  • Build and maintain data infrastructure for LLM workloads Work with cloud and platform teams to develop robust, production-grade infrastructure: data lakes / warehouses, feature stores, vector stores, and high-throughput data services used by training jobs and offline evaluation.
  • Collaborate closely with ML Research Engineers and security experts Translate modeling and security requirements into concrete data tasks: dataset design, splits, sampling strategies, and evaluation data construction for specific security use

Qualifications

What You Bring

  • 3+ years of hands-on experience as a Data Engineer or ML/Data Engineer, ideally in a product or platform team.
  • Strong programming skills in Python and experience with at least one additional language commonly used for data / backend (e.g., SQL, Scala, or Java).
  • Solid experience building ETL / ELT pipelines and batch/stream processing using tools such as Spark, Beam, Flink, Kafka, Airflow, Argo, or similar.
  • Experience working with cloud data platforms (e.g., AWS, GCP, Azure) and modern data storage technologies (object stores, data warehouses, data lakes).
  • Good understanding of data modeling, schema design, partitioning strategies and performance optimization for large datasets.
  • Familiarity with ML / LLM workflows: train/validation/test splits, dataset versioning, and the basics of model training and evaluation (you don’t need to be the primary model researcher, but you understand what the models need from the data).
  • Strong software engineering practices: version control, code review, testing, CI/CD, and documentation.
  • Ability to work independently and in collaboration with ML engineers, researchers and security experts, and to translate high-level requirements into concrete data engineering tasks.

Nice to Have

  • Experience supporting LLM or NLP workloads, including dataset construction for pre-training / fine-tuning, or retrieval-augmented generation (RAG) pipelines.
  • Familiarity with ML tooling such as experiment tracking (e.g., Weights & Biases, MLflow) and ML-focused data tooling (feature stores, vector databases).
  • Background in security / cyber domains (logs, alerts, incidents, SOC workflows) or other high-volume, high-variance data environments.
  • Experience with data quality and observability platforms, or building in-house monitoring for data freshness, drift and anomalies.
  • Experience in environments where data infrastructure directly affects training efficiency and GPU utilization.

Why Join Us

  • Work at the intersection of modern data engineering, LLMs and real-world cyber security, with immediate impact on global customers.
  • Own the data layer that makes advanced ML and LLM research possible, directly influencing training efficiency, quality and speed of iteration.
  • Collaborate with experienced ML engineers, researchers and security experts in a fast-moving, supportive environment.
  • Access modern cloud and GPU infrastructure and large, unique datasets from one of the world’s leading cyber security vendors.


במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.

מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.

שאלות ותשובות עבור משרת ML Data Engineer

כמהנדס/ת נתוני ML ב-Check Point Software, תהיה/תהיי אחראי/ת על בנייה ותפעול של תשתית הנתונים המאפשרת את מחקר ה-LLM וה-ML. זה כולל טיפול בכל מחזור חיי הנתונים, החל מהכנסה והעשרה, דרך תיוג ובקרת איכות, ועד אספקת נתונים יעילה לאימון והערכה של מודלים.

האחריויות העיקריות כוללות בעלות על צינורות נתונים לאימון והערכת LLM, תכנון ותחזוקה של צינורות מדרגיים להכנסה וטרנספורמציה של נתונים בקנה מידה גדול, הנעת העשרת נתונים ויצירת נתונים סינתטיים, בניית תהליכי תיוג וביאור, הבטחת איכות נתונים וניהול גרסאות, אופטימיזציה של זרימות נתוני אימון ליעילות ועלות, ובנייה ותחזוקה של תשתית נתונים עבור עומסי עבודה של LLM.

נדרשות לפחות 3 שנות ניסיון כמהנדס/ת נתונים או ML/Data Engineer, מיומנויות תכנות חזקות ב-Python וניסיון בשפה נוספת (SQL, Scala, Java), ניסיון מוצק בבניית צינורות ETL/ELT ועיבוד אצווה/זרם (Spark, Beam, Flink, Kafka, Airflow), ניסיון עם פלטפורמות נתונים בענן (AWS, GCP, Azure) והבנה טובה של מודלים של נתונים ואופטימיזציה עבור מערכי נתונים גדולים. היכרות עם זרימות עבודה של ML/LLM ופרקטיקות הנדסת תוכנה חזקות הן גם חיוניות.

משרות נוספות מומלצות עבורך
  • רשימת משאלות

    Senior ML Data Engineer - AV Dataset

    • map_icon ירושלים
    Mobileye

    Mobileye

לכל המשרות של מהנדס נתונים ללמידת מכונה

הכשרות רלוונטיות

NAYA College

NAYA College

BI & AI Automation Developer

  • ערב
  • סיבסוד סבסוד
NAYA College

NAYA College

Big Data and Hadoop Revolution

  • בוקר
NAYA College

NAYA College

Apache Spark Seminar

NAYA College

NAYA College

Essentials for Apache Hadoop

  • בוקר

ניתן לצפות במשרות שסימנת בכל שלב תחת התפריט הראשי בקטגוריית 'משרות שאהבתי'

המקום קרן עזריאלי טקסט בעברית עם סמל אינסוף
  • מי אנחנו
  • מעסיקים מובילים
  • צרו קשר
  • תנאי שימוש
  • מדיניות פרטיות
  • הצהרת נגישות

2026 Ⓒ ג'וביפיי - כל הזכויות שמורות

קרן עזריאלי טקסט בעברית עם סמל אינסוף social_security the_israeli_employment_service israel_innovation_authority work_office המקום
המערכת בונה את הפרופיל התעסוקתי שלך

עוד רגע...

המערכת זיהתה ששינית את הנתונים באזור האישי ומעדכנת את ההמלצות על תפקידים ומשרות בהתאם.

מצטערים, לא הצלחנו לנתח בהצלחה את הנתונים שהזנת.
אתם מוזמנים לנסות להזין שוב או להעלות קובץ קורות חיים במידה ויש לכם.
בהצלחה

הגעת להגבלה היומית של שלושה עדכונים בפרופיל האישי ביום

loader

הבקשה שלך נשלחה בהצלחה!

יש באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות מיועצת קריירה.

באפשרותך לשלוח בקשה לקבלת ייעוץ אישי ללא עלות

  • בעיה טכנית

  • סיוע בכתיבת קורות חיים או בהכנה לראיון עבודה

  • התאמה של משרות

  • אחר:

פנייתך נשלחה בהצלחה. נציג מטעם ארגון נכי צהל ייצור איתך קשר בהקדם