עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
About the Company: Cellebrite’s (Nasdaq: CLBT) mission is to enable its global customers to protect and save lives by enhancing digital investigations and intelligence gathering to accelerate justice in communities around the world. Cellebrite’s AI-powered Digital Investigation Platform enables customers to lawfully access, collect, analyze and share digital evidence in legally sanctioned investigations while preserving data privacy. Thousands of public safety organizations, intelligence agencies and businesses rely on Cellebrite’s digital forensic and investigative solutions—available via cloud, on-premises and hybrid deployments—to close cases faster and safeguard communities. To learn more, visit us at www.cellebrite.com, https://investors.cellebrite.com/investors and find us on social media @Cellebrite.
About the Role: We are looking for an AI Quality & Evaluation Engineer to own the quality planning and execution of an AI-powered chat application operating over complex law enforcement and mobile device data. This is a highly hands-on role focused on execution rather than high-level QA strategy. You will design, build, and run automated and semi-automated tests for LLM-driven workflows, create evaluation datasets, and continuously stress the system with realistic and extreme investigative scenarios.
Responsibilities:
- Design, plan, and execute quality tests for an AI chat application built on LLMs and investigative data.
- Build and maintain automation frameworks for prompt regression testing, multi-turn conversations, and model upgrades.
- Create and curate evaluation datasets used for regression testing, benchmarking, and model comparison.
- Design complex investigative scenarios including ambiguous, incomplete, or conflicting datasets.
- Execute manual exploratory testing to uncover hallucinations, reasoning failures, and edge cases.
- Work closely with engineering, product, and data teams as part of the development lifecycle.
- Validate release readiness and identify regressions related to prompts, models, or data pipelines.
Qualifications:
5+ years of experience in QA, test automation, or validation engineering.
Required Skills:
- Strong hands-on experience building automated tests.
- Experience testing complex, data-heavy systems.
- Familiarity with API testing tools (e.g., Postman).
- Strong analytical, debugging, and problem-solving skills.
- High attention to detail with the ability to see the bigger picture.
- Excellent English, written and spoken.
Preferred Skills:
- Experience testing AI, ML, or LLM-based systems.
- Experience with prompt testing or NLP evaluation techniques.
- Experience building synthetic or semi-synthetic datasets.
- Experience working with databases (SQL).
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
שאלות ותשובות עבור משרת Quality & Evaluation Engineer - GenAI Innovation Team
התפקיד המרכזי של מהנדס/ת Quality & Evaluation בצוות חדשנות GenAI בחברת Cellebrite הוא לתכנן ולבצע בדיקות איכות עבור יישום צ'אט מבוסס AI, המופעל על נתוני אכיפת חוק ומכשירים ניידים מורכבים. התפקיד כולל בניית אוטומציה, יצירת מערכי נתונים להערכה ובדיקת המערכת בתרחישי חקירה מציאותיים וקיצוניים.
משרות נוספות מומלצות עבורך
-
Senior QA Automation Engineer (Financial Apps)
-
תל אביב - יפו
Fireblocks
-
-
בודק/ת אוטומציה ובדיקות ידניות
-
באר שבע
Ness
-
-
מפתח/ת אוטומציה
-
אשדוד
Ness
-
-
QA Engineer - Front-End
-
גבעתיים
Personetics
-
-
Automation Engineer - Maternity Leave Replacement
-
גבעתיים
EARNIX
-
-
Quality Assurance Automation Engineer
-
ראשון לציון
One Systems
-
ערב
הרצליה