עדיין מחפשים עבודה במנועי חיפוש? הגיע הזמן להשתדרג!
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
Founding-level · in the code · owning perception end to end.
We send technicians into thousands of retail locations (7-Eleven, Kroger, the largest enterprise portfolios in the world) and they walk every store with a camera. Your job is to turn that raw video into structured truth. You'll build the perception engine that watches a walkthrough and answers what a site survey used to need a human for: what's in the store, what condition it's in, and what it costs to replace.
The challenge
- Inputs: raw on-site video from retail walkthroughs — handheld, real-world lighting, occlusion, motion blur.
- Goal: extract structured store attributes (fixtures, equipment, conditions, counts, dimensions) and auto-answer survey questions.
- The catch: an ingestion pipeline that works at scale — not for one client but for hundreds of enterprise clients, each with different site attributes and physical layouts.
What you'll do
- Contribute to the video-to-attributes pipeline end to end: ingestion, detection, segmentation, multi-frame tracking.
- Train and ship models that recognize retail fixtures, equipment, and site conditions from real footage.
- Fuse perception output with multimodal reasoning to populate our canonical attribute registry.
- Keep it fast and cheap at portfolio scale — this runs across thousands of stores, not a demo.
Must have
- Production-grade computer vision: object detection and segmentation shipped in real systems (not notebooks).
- Video / multi-frame understanding: tracking, temporal consistency across frames.
- A track record of taking models to production and owning them.
- Comfort with dirty, real-world capture and genuine evaluation rigor — you measure accuracy and reason about failure modes.
- High agency: you spot a perception bottleneck and build the fix without waiting for a ticket.
Nice to have (or fast to learn)
- Modern multimodal models / VLMs for reasoning over perception output.
- Exposure to 3D / depth / point-cloud data.
- Retail or built-environment domain experience.
Do not apply if you need a ticket queue or detailed specs handed to you. You'll navigate ambiguity and build.
במקום לעבור לבד על אלפי מודעות, Jobify מנתחת את קורות החיים שלך ומציגה לך רק משרות שבאמת מתאימות לך.
מעל 80,000 משרות • 4,000 חדשות ביום
חינם. בלי פרסומות. בלי אותיות קטנות.
שאלות ותשובות עבור משרת Computer Vision Engineer
התפקיד המרכזי של מהנדס Computer Vision בחברת Robotic Imaging, Inc. הוא להפוך סרטוני וידאו גולמיים שצולמו באלפי מיקומים קמעונאיים (כמו 7-Eleven ו-Kroger) למידע מובנה. המהנדס יבנה מנוע תפיסה שינתח את הסרטונים ויחלץ מהם תכונות חנות, מצב ציוד ועלויות החלפה, במקום סקר אנושי.
משרות נוספות מומלצות עבורך
-
Computer Vision Engineer
-
כפר ורדים
אקווהשילד
-
-
מהנדס.ת אלגוריתמי ראייה ממוחשבת
-
ירושלים
רפאל
-
-
Algorithms & Deep Learning Engineer
-
ראש העין
Kroll Consulting
-
-
AI Software Engineer
-
תל אביב - יפו
Orca AI
-
-
Computer Vision Algorithms Engineer
-
חיפה
אלביט מערכות
-
-
מהנדס /ת ראיה ממוחשבת עם ניסיון בסגמנטציה
-
פתח תקווה
המימד השלישי
-
ערב