• אני מאשר/ת קבלת דואר בנושא קורסים ואירועים מנאיה קולג'.


    תאריכים: 25/6/17

    קהל יעד: אנליסטים, אנשי BI, אנשי Big Data, בעלי תארים מתקדמים בסטטיסטיקה/מתמטיקה

    משך / תקופה: כ-7 חודשים

    Data Scientist Professional

     

    תיאור תפקיד Data Scientist

    הצורך להתמודד עם כמויות גדולות של מידע הוליד בשנים האחרונות תפקידים רבים והתמחויות שונות כגון ה-Data Analyst, ה-Business Intelligence וה-Big Data. עם זאת, היכולת לשלב בין כל אלו ולהוסיף עליהם נדבך ייחודי של חיזוי, נותרה נחלתם של מעטים, ובשנים האחרונות ביסס עצמו ה-Data Scientist/מדען נתונים כ"מקצוע הנחשק ביותר של המאה ה-21".

    תפקידו של מדען הנתונים הינו לבצע מחקרי מידע מעמיקים בכדי להפיק תובנות עסקיות לארגון, לנקות, לטייב ולסדר את המידע המשמש למחקרים השונים, להפעיל אלגוריתמים שונים של מידול, כריית מידע ו-Machine Learning על המידע, ולסייע בבניית תהליכי הכנת המידע ואופטימיזציה של האלגוריתמים השונים.

    הכישורים הנדרשים מ-Data Scientist רבים ומגוונים ומתמקדים ב-4 שלבים עיקריים של עבודה עם המידע:

    • השגת המידע – אינטגרציה של המידע מכמה מקורות, מהאינטרנט, יכולת עבודה עם כמויות גדולות של מידע (Big Data), יכולות של עיבוד מידע לא מובנה (Unstructured) .
    • חקירת המידע – יכולות תכנות, יכולת ניתוח סטטיסטי, יצירת חיבור בין בסיסי נתונים שונים
    • ניתוח אנליטי של המידע - יכולות של חיזוי, כריית מידע, אופטימיזציה, עיבוד מידע טקסטואלי ואנליזה של נתונים גדולים
    • הצגת המידע - יכולות של הצגת תוצרי מידע ויכולות ויזואליזציה שונות

    כל זה מלווה בחשיבה אנליטית, אינטואיציה עסקית, ומעל לכול – סקרנות ויצירתיות. זאת גם הסיבה שלא קיים כיום רקע אחיד לכל העוסקים בתחום, ונראה כי רקע מגוון דווקא תורם ליכולת לשים לב לפרטים וקשרים שונים ומפתיעים.

     

    תיאור ההכשרה

    במסלול זה נקנה את הכלים הנדרשים לכל שלב ושלב בעבודתו של ה-Data Scientist עם דגש על פרקטיקה ויכולות תכנות מתקדמות.

    בחלקו הראשון של הקורס נלמד לתכנת ב-Python, שהיא השפה המובילה כיום לפיתוח בתחום זה, ונרכוש כלים לעבודה עם נתונים ממקורות שונים ולהצגתם. נפתח מאפס קוד בסביבה מונחית-עצמים (Object-Oriented), שהיא המתודה הסטנדרטית כיום בפיתוח תוכנה, ונבין לעומק את היתרונות הגלומים במתודה זו. בנוסף נכיר את ספריית המודולים העשירה של השפה (Python Standard Library) ונדע כיצד להיעזר בה.

    בחלקו השני של הקורס נאפיין בעיות עסקיות מסוגים שונים ומגוונים ונתמודד איתן באמצעות מודלים של Machine Learning, תוך שאנו מעמיקים את היכרותנו עם שפת Python והרחבותיה. ראשית נאפיין את הבעיה הכללית של בניית מודל חיזוי, נכיר את עולם המונחים הרלוונטי, ונתוודע לספריה Scikit-learn, בה נשתמש לבניית מרבית המודלים. לאחר מכן נתמודד בזו אחר זו עם בעיות עסקיות מסוגים שונים, נבין לעומק את האתגרים הייחודיים לכל אחת מהן ונכיר וניישם מודלים שונים לפתרונן.

    בחלקו השלישי של הקורס נרחיב את היריעה במספר נושאים "חמים" בשוק. בנושא הראשון, חיזוי בזמן, נלמד לנבא התנהגויות בציר הזמן, ובפרט להתמודד עם תנודתיות עונתית. בנושא השני, ניתוח טקסטים, נלמד לאסוף ולנתח מידע טקסטואלי, וניחשף לעולם המופלא של עיבוד שפה טבעית (NLP). בנושא השלישי, Big Data, נלמד כיצד להתמודד עם מצבים, שהופכים להיות נפוצים יותר ויותר, בהם המידע רב ומבוזר עד כדי כך שלא ניתן לבצע את כל העיבוד שלו בתהליך חישובי יחיד.

    בחלקו הרביעי והאחרון של הקורס נטעם קצת משפה אחרת שקדמה ל-Python, ועל-כן לא פחות נפוצה ממנה – שפת R, ונראה כיצד בהבדלים טכניים מינוריים יחסית ניתן ליישם את כל המודלים שפגשנו בקורס גם באמצעותה.

    מעבר לתרגול השוטף שיתבצע כחלק מתהליך הלימוד של כל נושא, יינתנו במהלך הקורס פרויקטים עם נתונים "מן התעשייה", בהם נתמודד עם בעיות עסקיות קלאסיות.



    כל הזכויות שמורות © נאיה קולג’ 2017