Big Data – Cloudera Hadoop Expert
בכל יום אנחנו מייצרים 2.5 קווינטיליון בייטים של נתונים ולמעשה 90% מהמידע שקיים בעולם נוצר במהלך השנתיים האחרונות.
הנתונים הללו מגיעים מכל מקום: מחיישנים שאוספים מידע אקלימי, מתגובות באתרי מדיה חברתית, מתמונות דיגיטליות וסרטונים שמועלים לרשת, מרישומים של רכישות מקוונות ומסימני GPS של טלפונים סלולריים. מידע הזה הוא Big Data ביג דאטה – מדובר באתגר עסקי וטכנולוגי בפניו עומדים ארגונים רבים ולהתמודד איתו ישנן פלטפורמות NoSQL, כגון: Hadoop.
אלו הם מאגרי מידע הכוללים נתונים בנפחים גדולים, התומכים במידע שאינו מאורגן לפי שיטה כלשהי – Unstructured. אלו בסיסי נתונים התומכים במידע אשר מגיע ממקורות רבים, בכמויות גדולות, בפורמטים מגוונים ובאיכויות משתנות.
Big Data הוא לא רק אתגר, הוא למעשה גם הזדמנות לחשוף תובנות חדשות מתוך סוגים חדשים של מידע, להפוך עסקים לגמישים יותר, תחרותיים יותר ולפתור שאלות שבעבר נותרו ללא מענה.
Hadoop הינו שם קוד לפרויקט-על מבוסס קוד פתוח של קרן התוכנה אפאצ’י, שמטרתו לעבד כמויות גדולות של נתונים (Big Data) בסביבת הפיתוח. Hadoop מאפשר עבודה של אלפי יחידות עיבוד (Nodes) המטפלות בו זמנית במידע בהיקף של Petabytes. העבודה הינה על קבצים גדולים המפוזרים על פני אשכולות מחשבים, תוך שימוש במודל תכנות פשוט. זוהי תשתית המאפשרת לחבר בעזרת תוכנה עשרות, מאות ואלפי שרתים בסיסיים – לסביבה אחת פשוטה.
תיאור התפקיד:
בעולם טכנולוגי ועסקי, הנתונים והמידע הם הנכס האמיתי של כל ארגון בעולם. מסלול ההכשרה Big Data Expert מוביל את המועמד לתפקיד העתיד של עולם הנתונים והמידע וזאת ההזדמנות שלך להתנסות ולהכיר לפני כולם את הטכנולוגיות המובילות בעולם! במסלול הכשרה זה, נתמקד בבסיס הנתונים Cloudera’s Apache Hadoop הנחשב לבסיס הנתונים הפופולארי ביותר בעולמות ה- Big Data ונמצא בשימוש חברות רבות.
לצפייה בוובינר שהתקיים עבור קורס Cloudera’s Hadoop – Big Data Expert :
בעלי רקע טכנולוגי בתחום מסדי הנתונים (DBA), בינה עסקית (BI) או פיתוח תוכנה עם ניסיון בעבודה מול בסיסי נתונים רלציונים (RDBMS) כגון: Oracle, SQL Server, MySQL, PostgreSQL או DB2.
המסלול משלב שלושה מודולים עיקריים אותם מומחה ביג דאטה חייב להכיר לעומק:
Data Analytics – מודול זה מתמקד בכלים שונים המאפשרים ניתוח יעיל, מהיר ופשוט של נתונים בסביבת Hadoop, על מנת לייצר ערך עסקי לארגון מהנתונים שבבעלותו. נשתמש בשלושה כלים עיקריים:
- PIG – מימוש תהליכים של גזירה וניתוח נתונים (ETL )
- HIVE – תחקור נתונים עם דגש על Unstructured complex types
- Impala – כלי לתחקור אונליין
Hadoop Administration – מודול זה מתמקד בצד התשתיתי של Hadoop, ניהולו בסביבת Production ו- Development, כולל התקנה, קונפיגורציה, פעולות תחזוקה, אבטחה, ניטור ועוד.
Hadoop Developing with Spark – מודול זה מתמקד בעיבוד נתונים באמצעות כתיבת קוד, אשר מופעל בצורה מקבילית, על פני שרתים מרובים יחד. Apache Spark – הוא מנוע עיבוד מהיר במיוחד ליישומי Big Data המתבצעים על גבי מערכות בתצורת אשכול ובמיוחד במערכי מחשוב גדולים. המערכת מציעה מהירות שימוש, קלות יישום, ועמידות גבוהה בעבודה במתכונת Agile. כמודול הכנה לפיתוח ב- Spark, יועבר מודול פיתוח ב- Scala.

- מועד פתיחה
- ב' 17:30-21:30 | ו' 9:00-13:00
ימים ושעות
- 170
שעות אקדמיות
- מתקדם
רמת הקורס
- עברית
שפת הדרכה
לבדיקת התאמה לקורס
ממליצים
לפתיחה והורדת סילבוס