תחום מדעי בין-תחומי המאפשר למחשבים לראות, לזהות ולעבד תמונות בדומה לעין האנושית, טכנולוגיית Computer Vision (CV) משנה במהירות את הנוף הקמעונאי. שלושה מומחים ב-Trax מלווים אותנו על העתיד של יישומים מבוססי קורות חיים בקמעונאות.
מומחי ה-Trax שלנו
אנו יודעים ש-CV הוא בהשראת הקורטקס החזותי האנושי. האם אנחנו בשלב שבו מכונות נמצאות בשוויון או אפילו טובות יותר בזיהוי או סיווג אובייקטים מאשר הראייה האנושית?
זיו: בהחלט. למעשה, בכמה משימות, השגנו רמות ראייה על-אנושיות עם מחשבים. לדוגמה, באתגר ImageNet המפורסם , אתה מאכיל למערכת אלפי מחלקות של אובייקטים כמו "ספינת מיכל", "קרדית", "פטריה" או "דובדבן", והמחשב צריך לסווג תמונות לכל אחת מהמחלקות הללו. ומה שראינו הוא שהדיוק של המועמדים הטובים ביותר בתחרות השתפר באופן דרסטי - מסביבות 74 אחוז ב-2012 ל-95 אחוז ב-2017.
במילים פשוטות, זה אומר שמחשבים משתפרים אפילו מבני אדם בסיווג עצמים בצורה נכונה.
העין האנושית סובלת מהטיות מולדות מסוימות, לעתים קרובות כתוצאה ממאות שנים של נטיות לחיפוש דפוסים של אבותינו. האם ניתן לאמן מכונות להיות חסינות לטיפשות?
דולב: מערכות קורות חיים הן בהחלט לא הוכחה לשטויות. בדומה לאשליות האופטיות שמבלבלות את המוח האנושי, ניתן להערים על מערכות קורות חיים באמצעות "תמונות יריבות". אלו הם דפוסים ותמונות המנצלים חולשות באלגוריתמי קורות חיים כדי לרמות אותם ולטעות בין פנדה לגיבון או חתול לגוואקמולי. למעשה, צוות סטודנטים ב-MIT פרסם בשנת 2017 מחקר שהראה כיצד הם יכולים לרמות מערכת ולסווג באופן שגוי תמונה של צב מודפס בתלת-ממד כרובה!
שחקנים זדוניים עלולים להשתמש בזה כדי לגרום נזק, כמו מניפולציה של כלי זיהוי פנים כדי לזהות את האנשים הלא נכונים או לתקוף את מערכות קורות החיים המאפשרות מכוניות בנהיגה עצמית. לדוגמה, תיקון קטן בצד הכביש המהיר יכול לגרום למכונית בנהיגה עצמית לחשוב שהיא מסתכלת על תמרור עצור.
אילו יישומים מהחיים האמיתיים של Computer Vision אתה מתלהב מהם?
זיו: יישומים רבים נתקעו לפני למידה עמוקה, עם שיפורים קטנים מאוד בדיוק - 0.3 אחוז בערך מדי שנה. אבל עם ההתקדמות בלמידה עמוקה, קורות החיים חוו קפיצת מדרגה גדולה מאוד, שהובילה ליישומים רבים בין תעשיות.
תעשיית הרכב האוטונומי רוחשת פעילות עם מספר יצרנים וענקיות טכנולוגיה גדולות שנכנסות לשוק. בהתבסס על רמת האוטונומיה המוצעת, כלי רכב בנהיגה עצמית מתחלקים לחמישה שלבים; החל מרכבים ברמה 1 הדורשים מעורבות משמעותית מהנהג האנושי ועד לרמה 5 – רכבים אוטונומיים לחלוטין. רוב כלי הרכב הנוהגים בעצמם בימינו נופלים לרמה 4, שבה נהיגה עצמית אפשרית אך בתוך מסלולים ממופים מראש.
יאיר: התעשייה הביטחונית ממשיכה להיות ללא ספק המשתמש הדומיננטי ביותר בטכנולוגיות כאלה. זה די נפוץ לראות מדינות משתמשות בחיישנים ומזל"טים מצוידים במצלמה בסביבת שדה קרב כדי לפתח אסטרטגיות לחימה בטוחות יותר ולהגן על חיילים.
שימוש פחות מוכר אך בעל השפעה מסיבית ב-CV הוא בניתוח ובניטור יבולים בחקלאות. באמצעות מזל"טים צמודים למצלמה, חקלאים יכולים לצלם תמונות של השדה כדי לזהות את בריאותם של יבולים, נגיעות מזיקים וחסרים אחרים שעלולים להשפיע על תפוקת הקציר.
דולב: אבל זה קמעונאות שאנחנו אובססיביים לגביו! אנו משתמשים בקורות חיים כדי ללכוד תמונות מדף כדי לנתח מוצרים בודדים. Trax עוזרת לבצע דיגיטציה של המדף כדי לצמצם את זמני הביקורת לנציגי המכירות, ולתרגם את התמונות לנתונים לניהול קטגוריות, שיווק קונים וצוותי תכנון שטחים כדי לצמצם את המלאי, לשפר את ההפצה ולהשיג נתח שוק על פני המתחרים.
האם קורות חיים יהפכו למצרך?
יאיר: למידה עמוקה סידרה כמה יישומים של ראייה ממוחשבת. זיהוי חפץ בטלפון הנייד שלך זה כבר לא משהו שרק החברות הגדולות יכולות לעשות. כל אחד יכול לקחת קוד קוד פתוח, מערכי נתונים ציבוריים ולאמן מערכת די בקלות. אלה יכולים לספק לך רמת דיוק סבירה מאוד בזיהוי אובייקטים.
שחקנים גדולים כמו גוגל, פייסבוק, מיקרוסופט ואמזון יוכלו בקרוב להציע פתרונות קורות חיים מהקופסה עבור יישומים מיינסטרים. אבל אם אתה רוצה לפתח משהו חדש או נישה או לקחת את היכולות של אפליקציה לשלב הבא, אתה צריך יכולות נישה.
זיו : בוא ניקח את המגזר הקמעונאי כדוגמה. בעוד שהאלגוריתמים המתקדמים של זיהוי תמונה של היום מסוגלים לזהות אובייקטים בתוך תמונה בדיוק רב, התהליך הופך להרבה יותר מורכב בסביבה קמעונאית.
כאן יש לך מאפיינים שאינם נפוצים - סביבות צפופות, SKUs משתנים ללא הרף, מוצרים כמעט זהים או דומים. אז פלטפורמת זיהוי תמונה אוטומטית חייבת להיות מסוגלת לעמוד בקריטריונים מרכזיים מסוימים כדי להבטיח רמת דיוק גבוהה - היכולת להבחין בין מספר מוצרים שכמעט זהים במראה, להתגבר על אריזות לא ברורות ומשתקפות בתנאי תאורה גרועים, ולזהות שינויים במחזור החיים של המוצר כמו גרסאות עיצוב חדשות.
דוגמה להבדלים באריזה על בקבוק קוקה קולה קלאסי 1 ליטר
למה אנחנו יכולים לצפות מ-Trax - על אילו אפליקציות מגניבות אתה עובד?
דולב: אפליקציה אחת שאנחנו די מתלהבים ממנה היא Store Mapper. הוא משתמש בזיהוי תמונות כדי למפות חנויות קמעונאיות פיזיות ולדיגיטציה שלהן למפה דו-ממדית. קונים יכולים להשתמש באפליקציה בטלפונים שלהם כדי להיות מופנים למעברים הנכונים באמצעות מדריכי מיקום מבוססי AR, ממוקדים במבצעים מבוססי מיקום ולקבל התראה על כל פריט שנגמר. סריקת מוצר בטלפון תפתח את המידע והערך התזונתי שלו, בעוד שעוזר וירטואלי עוזר לקונים להוסיף ולעקוב אחר הרשימות שלהם.
למידע נוסף על האופן שבו Computer Vision התפתח ממעבדות מחקר של סטודנטים למציאת יישומים שימושיים בתעשיות, הורד את הספר האלקטרוני שלנו "העבר, ההווה והעתיד של Computer Vision".