איך Machine Learning מסייע במהפכת זיהוי התנהגות הלקוח?

היום, כאשר יש יותר ויותר נתונים זמינים אשר מסייעים לקבל תובנות אודות התנהגות הלקוחות, ארגונים מתחילים לנצל את הנתונים באופן חכם יותר וכך מסוגלים לשפר את חוויית הלקוח. עם זאת, חיזוי התנהגות הלקוחות עדיין מהווה אתגר רציני ולא פשוט.

במאמר זה ננסה להסביר איך תהליכי Machine Learning מסייעים לזהות דפוסי התנהגות הלקוח ולהבין טוב יותר מה הלקוח רוצה לקבל או מה הצעד הבא שלו.

כיום חברות מנסות לפתור סוגיות רבות ולאתר פתרונות לבעיות עסקיות באמצעות ניתוח חכם של הנתונים אך עדיין מוגבלות במה שהן יכולות לעשות עם הנתונים שלהן, ולכן שוקלות את הצעד הבא.

לעתים קרובות, ארגונים מנתחים נתונים דרך שימוש במערכות מידע מסורתיות, וניצול מקסימלי של Data Warehouse שלהם, אך עדיין מחפשים דרך להפיק יותר ולהיות מסוגלים להשתמש בנתונים בדרכים חדשניות.

כיום המטרה ברוב המקרים הינה לחזות את הצעד הבא של הלקוח ובכך להוסיף ערך עסקי אמיתי.

יש הרבה בלבול לגבי מה בעצם עושה Data Scientist – מדען הנתונים.

מדען נתונים הוא מישהו שיכול לייצר קשר בין מה שקרה “לפני” לבין מה שיקרה “אחרי”, וזה כולל:

  • זיהוי מקורות נתונים חדשים, מפני שניתוח נתונים מסורתי או מסדי נתונים מסורתיים אינם מסוגלים לגשת אליהם בשל הפורמט שונה, הגודל או המבנה.
  • איסוף, התאמה וניתוח נתונים ממקורות נתונים מרובים.
  • יישום של האלגוריתם הנכון כדי לקבל ערך מהנתונים.

בסופו של דבר המטרה של מהפכת זיהוי התנהגות הלקוח הינה:

  • איתור מידע נוסף אודות הלקוח
  • יישום תהליכים חדשים על מנת להדגיש את המומחיות החברה
  • שימוש בתהליך למידה חדש כדי לשנות את העסק

להמחשת התהליך המורכב הזה, ניקח לדוגמה אפליקציית מובייל של חברת כרטיסי אשראי, אשר מציגה מודעות פרסום הקשורות לרכישות הלקוח באמצעות פלטפורמה card-to-link – שזוהי הפלטפורמה המציגה מודעות פרסום ומחליטה איזה מודעה רלוונטית ללקוח ספציפי.

המפרסמים הם בתי מרקחת, מסעדות, חנויות וכו’, והם רוצים להציג את המודעות ללקוחות פוטנציאליים.

כדי למקד מודעות ללקוחות רלוונטיים, חייבים לחזות במדויק את הסבירות שהלקוח ילחץ על המודעה – “click-through rate” או CTR, המכונה גם “שיעור קליקים”.

פלטפורמות card-to-link מסוגלות להציג מודעות הקשורות לרכישות, ועדיין ישאפו לעשות עבודה טובה יותר של מיקוד ומדידת ההצלחה של המודעות שלהן.

מצד שני, גם המפרסם מעוניין לאתר לקוחות חדשים.

בהמשך לדוגמא שלנו – עבור המפרסם – פיצריה, פלטפורמות card-to-link תדע לקשר בין המוצר ללקוח באמצעות ניתוח התנהגות הצרכנית ותציג את הפרסומת ללקוח רלוונטי, היא אפילו תדע לאתר את הלקוחות הקרובים לפיצריה (לפי המיקוד של כתובת המגורים של הלקוח הקיים).

וזה עובד נהדר, אולם אם מגדיר מטרה מורכבת יותר: השיטה הקיימת הגדילה לקוחות חדשים ב-10%, אבל הפיצריה מעוניינת להגדיל את הלקוחות החדשים שלה ב-30%. מה צריך להיעשות במקרה הזה?

רק באמצעות ניתוח הנתונים המסורתי לא ניתן לספק את התוצאות הרצויות.

יש צורך בחיזוי התנהגות הלקוח בדרך חדשה החל משימוש במקורות מידע חדשים/נוספים ועד להרצת מודלים שונים של Machine Learning . ננסה לפרט.

שלב ראשון:

השאלה הראשונה של Data Scientist היא איזה סוג דאטה יש ל- card-to-link וניתן להשתמש בו על מנת להגדיל את כמות הלקוחות החדשים מ-10% ל-30% ובכך למקסם את הרווח של הקמפיין הזה?

השלב הראשון הוא השגת מידע.

הנתונים החדשים מגיעים מהיסטוריית הגלישה באינטרנט; והם מורכבים ממיליארדי ID של מכשירים וכן ממילות מפתח בהיסטוריית הגלישה עבור כל ID.

אז איך Data Scientist יכול לקחת את הנתונים החדשים ולאתר קהל גדול יותר?

שלב שני:

שינוע הנתונים. הואיל ומדובר בכמויות דאטה עצומות, הפלטפורמה עומדת בפני אתגר ה-Big Data, וכאן כפתרון באות טכנולוגיות NoSQL, כגון Hadoop. למעשה כל המידע אודות הרכישות של הלקוחות, היסטוריה של גלישה והיסטוריה של מסע הפרסום מיוצא ממחסן נתונים מסורתי לפלטפורמות NoSQL. הדאטה הנאסף משמש לחקירה אינטראקטיבית ועיבוד מוקדם (pre-processing) של נתונים באמצעות מנוע שאילתות SQL.

שלב שלישי:

כעת יש לבצע Feature Extraction – איתור תכונות ייחודיות בנתונים בהן ניתן להשתמש כדי לבצע תחזיות.

Feature Engineering הוא תהליך של הפיכת נתונים גולמיים לשימושיים עבור אלגוריתם Machine Learning. הכלי הנפוץ היום להרצה של מודלים בסביבה של Big Data הוא Spark עם שימוש ב-Spark MLlib. כדי להשתמש באלגוריתמים ב-Spark, התכונות צריכות להיות מסודרות לתוך Feature Vectors – וקטורים של מספרים המייצגים ערך עבור כל תכונה. כדי לבנות מודל סיווג/קלסיפיקציה (classifier model), יש להריץ תהליכי חילוץ ובדיקה כדי לאתר את תכונות העניין שיתרמו לסיווג. גם דאטה שהוא טקסט ניתן לעיבוד, וגם אותו ניתן להפוך לווקטורים של מספרים.

המערכת יודעת לזהות את המילים החשובות ביותר בתוך המסמך תוך השוואה בין כל המסמכים.

זאת נעשה ע”י בדיקה של כמות פעמים שמילה מופיעה במסמך מסוים וכן מספר פעמים שהמילה מופיעה בסדרה או אוסף של מסמכים.

לדוגמה, אם היה אוסף של מסמכים על כדורגל, אז המילה “זעזוע” במסמך תהיה רלוונטית יותר עבור המסמך מאשר המילה “כדורגל”.

שלב רביעי:

שלב הרצה של מודל Machine Learning. 

דוגמא שלנו אנחנו מדברים על מודל מסוג Classification – סיווג (קלסיפיקציה). מדובר במשפחה של אלגוריתמים, אשר מזהים את הקטגוריה שאליה שייך פריט (כגון אם לקוח אוהב פיצה או לא), בהתבסס על נתונים מסומנים (כגון היסטוריית רכישות). מודל קלסיפיקציה לוקח קבוצה של נתונים מתויגים ותכונות ולומד כיצד לתייג רשומות חדשות על סמך מידע זה.

בדוגמה שלנו, היסטוריית הרכישות משמשת לתיוג לקוחות שרכשו פיצה, והיסטוריית הגלישה עם מיליוני מילות מפתח, שלרוב אין להם שום קשר לפיצה, משמשת ליצירת תכונות שמציגות קווי דמיון ומקטלגות לפי סוגי לקוחות.

ברגע שהיסטוריית הגלישה והרכישות מסווגת בתור וקטורים, אלגוריתם כגון רגרסיה או עץ החלטות או random forests ישמש לבנייה של מודל מתאים ש”יודע/למד” על הדאטה הקיים ויכול לבצע תחזית על הדאטה החדש. ניתן להשתמש במודל על מנת לדרג מליארדי ID של אוהבי פיצה מהגדול לקטן. התוצאה הזו תיתן לנו את אוהבי פיצה פוטנציאליים וכך ניתן להשיג מטרה של גידול לקוחות.

שלב חמישי – השלב של אחרי:

בהמשך להרצה של מודל, ניתוח נתונים ומתן תחזית, תתקבל החלטה על קמפיין בפרסומי כזה או אחר לקהלי יעד השונים בהתאם להתנהגות הצרכנית שלהם.

הקמפיינים יוצגו לאוכלוסיות יעד שונות וניתן יהיה לבצע השוואה בין תוצאות הקמפיינים לבין התחזית שסופקה בהרצה של המודל.

בדוגמא שלנו נכין גרף של תוצאות קמפיינים ונסווג לקוחות לפי התנהגות הקניה שלהם, כמובן בהתאם לסיווג האוכלוסיות שנוצר ע”י האלגוריתם. כך לדוגמא, אלה יהיו לקוחות ש:

  • רכשו פיצה בהגעה לפיצריה
  • רכשו פיצה במסעדה בישיבה
  • רכשו פיצה במשלוח
  • רכשו פיצה קפואה בסופרמרקט

הלקוחות המסווגים יתוארו באמצעות קווים בצבעים השונים.

  • על ציר Y (הציר האנכי) נציג אחוז לקוחות שלחצו על פרסומת באפליקציה.
  • על ציר X (הציר האופקי) נציג הסתברות הצפויה שאדם ילחץ על המודעה.

אם הקווים הצבעוניים ממשיכים לעלות משמאל לימין, פירוש הדבר שהמודל פעל היטב בעת חיזוי שיעורי הקליקים.

אם לסוג לקוח מסוים נראה ירידה באחוזי הקלקה לעומת ההסתברות הגבוהה, ניתן להסיק שהקמפיין נכשל. זה מראה כי היסטוריית הגלישה אינה חלה למעשה על שיעורי קליקים מוגברים עבור הקמפיין הספציפי, ופלטפורמת click-to-link לא ידעה לזהות זאת.

אלו הן תובנות שניתן להשתמש בהן, לדוגמה, אם ל- click-to-link יש מודל קמפיין אחר או בקבלת החלטה על מסע קמפיין חדש/נוסף. זוהי שיטה שעובדת היטב וניתן להשתמש בה עבור מפרסמים שישלמו כדי למקד את הפרסומות ללקוחות רבים יותר.

לסיכום

במאמר זה, דנו כיצד Data Science יכול להשתמש בנתונים התנהגותיים של לקוחות, לטייב קמפיינים פרסומיים ולהביא יותר לקוחות לחברה. במאמרים נוספים נדבר על שימושים נוספים של Machine Learning. עקבו אחרינו.