• אני מאשר/ת קבלת דואר בנושא קורסים ואירועים מנאיה קולג'.


    תאריכים: 27/4/17

    קהל יעד: בעלי רקע ונסיון בתחום מסדי הנתונים (DBA), בינה עסקית (BI) או פיתוח תוכנה עם ניסיון בעבודה מול בסיסי נתונים רלציונים

    משך / תקופה: 4 חודשים

    Cloudera Hadoop - Big Data Expert

    מה זה Big Data?

    בכל יום אנחנו מייצרים 2.5 קווינטיליון בייטים של נתונים. למעשה 90% מהמידע שקיים בעולם נוצר במהלך השנתיים האחרונות. הנתונים הללו מגיעים מכל מקום: מחיישנים שאוספים מידע אקלימי, מתגובות באתרי מדיה חברתית, מתמונות דיגיטליות וסרטונים שמועלים לרשת, מרישומים של רכישות מקוונות ומסימני GPS של טלפונים סלולריים. 

    המידע הזה הוא Big Data – ביג דאטה – מדובר באתגר עסקי וטכנולוגי בפניו עומדים ארגונים רבים ולהתמודד איתו באות פלטפורמות NoSQL, כגון Hadoop. אלה הם מאגרי מידע הכוללים נתונים בנפחים גדולים, התומכים במידע שאינו מאורגן לפי שיטה כלשהי Unstructured)). אלו בסיסי נתונים התומכים במידע אשר מגיע ממקורות רבים, בכמויות גדולות, בפורמטים מגוונים ובאיכויות משתנות.  ל- Big Data שלושה מאפיינים: נפח, מהירות ומגוון.

    ·        נפח – עסקים כיום מוצפים מרגע לרגע בנתונים וצוברים בקלות טרהבייטים ואפילו פטהבייטים של מידע, המגיע ממקורות כגון: אתרי אינטרנט, רשתות חברתיות, מכשירים סלולריים, מצלמות אבטחה, סנסורים ועוד

    ·        מהירות –  המהירות שבה מידע חדש נוצר ונכנס או יוצא מהמערכת, בעולם שבו בכל שנייה נכנס מידע רב למערכות, היכולת להתמודד עם שטף המידע היא אתגר קשה מאוד.

    ·        מגוון - סוגי המידע הנאספים, כמות המקורות וכדומה. את המידע הנכנס לארגון לא ניתן כבר לסדר בצורה טבלאית (שורות ועמודות שהוא מידע מובנה) ולכן האתגר הוא לנהל מידע ששונה לחלוטין במבנה שלו (טקסט, שמע, וידאו, לחיצות עכבר, קבצי לוג ועוד.)

    Big Data הוא לא רק אתגר, הוא למעשה גם הזדמנות לחשוף תובנות חדשות מתוך סוגים חדשים של מידע, להפוך עסקים לגמישים יותר, תחרותיים יותר ולפתור שאלות שבעבר נותרו ללא מענה.

    Hadoop הינו שם קוד לפרויקט-על מבוסס קוד פתוח של קרן התוכנה אפאצ'י, שמטרתו לעבד כמויות גדולות של נתונים (Big Data) בסביבת הפיתוח.Hadoop  מאפשר עבודה של אלפי יחידות עיבוד (Nodes) המטפלות בו זמנית במידע בהיקף של Petabytes. העבודה הינה על קבצים גדולים המבוזרים על פני אשכולות מחשבים, תוך שימוש במודל תכנות פשוט. זוהי תשתית המאפשרת לחבר בעזרת תוכנה עשרות, מאות ואלפי שרתים בסיסיים - לסביבה אחת פשוטה

    אודות ההכשרה

    בעולם טכנולוגי ועסקי, הנתונים והמידע הם הנכס האמיתי של כל ארגון בעולם. מסלול ההכשרה Big Data Expert מוביל את המועמד לתפקיד העתיד של עולם הנתונים והמידע וזאת ההזדמנות שלך להתנסות ולהכיר לפני כולם את הטכנולוגיות המובילות בעולם!

    במסלול הכשרה זה, נתמקד בבסיס הנתונים Cloudera’s Apache Hadoop הנחשב לבסיס הנתונים הפופולארי ביותר בעולמות ה- Big Data ונמצא בשימוש חברות רבות.

    המסלול משלב שלושה מודולים עיקריים אותם מומחה ביג דאטה חייב להכיר לעומק:

    Data Analytics – מודול זה מתמקד בכלים שונים המאפשרים ניתוח יעיל, מהיר ופשוט של נתונים בסביבת Hadoop, על מנת לייצר ערך עסקי לארגון מהנתונים שבבעלותו. נשתמש בשלושה כלים עיקריים:

    • PIG – מימוש תהליכים של גזירה וניתוח נתונים (ETL )
    • HIVE – תחקור נתונים עם דגש על Unstructured complex types
    • Impala – כלי לתחקור אונליין

    Hadoop Administration – מודול זה מתמקד בצד התשתיתי של Hadoop, ניהולו בסביבת Production ו- Development, כולל התקנה, קונפיגורציה, פעולות תחזוקה, אבטחה, ניטור ועוד.

    Hadoop Developing with Spark – מודול זה מתמקד עיבוד נתונים באמצעות כתיבת קוד, אשר יפעל בצורה מקבילית, על פני שרתים מרובים אשר יחד. Apache Spark  - הוא מנוע עיבוד מהיר במיוחד ליישומי Big Data המתבצעים על גבי מערכות בתצורת אשכול, ובמיוחד במערכי מחשוב גדולים. המערכת מציעה מהירות שימוש, קלות יישום, ועמידות גבוהה בעבודה במתכונת  Agile. כמודול הכנה לפיתוח ב- Spark, יועבר מודול פיתוח ב – Scala.



    כל הזכויות שמורות © נאיה קולג’ 2017