עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
About Us:
Zenity is the first and only holistic platform built to secure and govern AI Agents from buildtime to runtime. We help organizations defend against security threats, meet compliance, and drive business productivity. Trusted by many of the world’s F500 companies, Zenity provides centralized visibility, vulnerability assessments, and governance by continuously scanning business-led development environments. We recently raised $38 million in a Series B funding, solidifying our position as a leader in the industry and enabling us to accelerate our mission of securing AI Agents everywhere.
About the Role:
This is a research‑first role focused on deeply understanding LLM internals to improve the security of AI agents.
You’ll design careful experiments on activations and interpretable features- e.g., probing, attribution & ablation/patching, representation‑geometry analyses-to uncover mechanisms behind jailbreak, indirect prompt injection, and other attacks.
Then translate those insights into signals that can be used for detection and analysis of a model response.
The field of LLM interpretability at scale is exploding, with several major publications in the last months, and major opportunities for innovation.
Responsibilities:
- Investigate model internals, including activation/features analysis, unsupervised clustering, discovery of directions in latent space, etc. It may also require training specific model parts to improve interpretability metrics.
- Design security‑grounded evaluations: curate datasets for different attack types, evaluate performance of different white box (model internals) methods compared to black box (input/output only) baselines.
- Publish and share: produce Zenity Labs posts and open artifacts; when the work is strong, aim for tier‑1 ML venues (NeurIPS, ICML, etc.) and security forums. A publication of code and/or trained models in cases of community relevant novelty.
- Build tools: Several open source libraries exist (like Anthropic’s attribution graphs infra), but the research in the field is very dynamic, which will require you to build and adapt tools to your own research directions. This also includes agents to automate research work and distill knowledge from designed experiments.
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
שאלות ותשובות עבור משרת Artificial Intelligence Researcher
חוקר בינה מלאכותית בזניטי מתמקד בהבנה מעמיקה של המבנה הפנימי של מודלי שפה גדולים (LLM) כדי לשפר את אבטחת סוכני AI. התפקיד כולל תכנון ניסויים מורכבים על הפעלות ותכונות ניתנות לפירוש, במטרה לחשוף מנגנונים מאחורי התקפות כמו Jailbreak והזרקת פרומפטים עקיפה, ולתרגם תובנות אלו לאותות לזיהוי וניתוח תגובות מודל.
משרות נוספות מומלצות עבורך
-
AI Researcher - Foundation Models & Generative AI - Base44
-
תל אביב - יפו
Wix
-
-
AI Researcher
-
תל אביב - יפו
Paragon
-
-
Agentic AI Researcher
-
תל אביב - יפו
UVeye
-
-
Senior AI Researcher
-
תל אביב - יפו
Zenity
-
-
Artificial Intelligence Researcher
-
הרצליה
Mentee Robotics
-
-
AI Researcher - World Model
-
תל אביב - יפו
Autobrains Technologies
-