בסיסי נתונים – תוכן עניינים:
- מה התפקיד של בסיסי הנתונים?
- אילו סוגים של בסיסי נתונים קיימים היום?
- בסיסי נתונים רלציונים – RDBMS
- בסיסי נתונים לא רלציוניים – NoSQL
- מה התפקיד של מנהלי בסיסי הנתונים?
- מה חשוב לדעת כשבוחרים איפה ללמוד?
מהם בסיסי הנתונים? איזה סוגים קיימים ומהן הטכנולוגיות הרלוונטיות לניהולם?
מה זה מסד נתונים? בסיסי נתונים, Database, משמשים היום כמאגר המידע העיקרי והחשוב ביותר בכל ארגון. מדובר במערכת אשר כוללת את כל המידע שהארגון זקוק לו, בין אם זה מידע על הלקוחות, על הספקים ועל העובדים, נתוני מלאי, מכירות ועוד – כל מידע הקשור לפעילות הארגון נמצא בתוך אותם בסיסי נתונים.
בסיסי הנתונים מאפשרים לנו להפיק דוחות המתבססים על אותם נתונים, כמו דוחות מכירות, דוחות מלאי, שעות עבודה של עובדים, מידע על לקוחות או כל דבר אחר. כמו כן בסיסי נתונים פועלי באינטגרציה מלאה עם מערכות נוספות בארגון כך שבכל רגע נתון מספקות מידע רלוונטי.
מבחינה טכנולוגית, בסיס נתונים הוא כלי/תוכנה שמאחסן את הנתונים ומאפשר שליפה, בדיקה ועדכון של חלקים מסוימים של נתונים באופן מהיר וקוהרנטי – DBMS – database management system.
לדוגמא – גולש באתר אינטרנט של חברת מוצרים שמעוניין לבדוק מהם המוצרים (והמחירים) שיש לחברה בקטגוריה מסוימת – מקבל בקליק אחד את כל המידע שביקש. למעשה מאחורי הקלעים פעל בסיס נתונים שסיפק את המידע על פי הבקשה (הקלקה על שדה כלשהו באתר החברה) של הגולש.
כשמדובר בחברה קטנה, או בבעל עסק פרטי, או אפילו במחשב האישי שלנו – גם כלים כמו אקסל – הינם בסיסי נתונים. גיליונות אלקטרוניים הם סוג של מסד נתונים שבו הנתונים מאוחסנים בגיליון אחד או יותר.
בתוך גליונות עבודה, הנתונים מאורגנים בעמודות ובשורות בתוך התאים. כלומר המידע שנמצא בהם מאורגן ומסודר לפי לוגיקה מסוימת.
כשמדובר בארגונים גדולים יותר, עם כמויות נתונים גדולות וצרכים ארגוניים הדורשים שימוש בכלים וטכנולוגיות מתקדמים, גדולים וחזקים יותר – נראה שימוש במסדי נתונים מאסיביים יותר עליהם נפרט בהמשך.
אז מה הם המצבים בהם ארגון נדרש לבסיס נתונים “כבד” יותר?
האם הארגון מאחסן נתונים ממכשירי IoT (“אינטרנט של דברים”) או ביג דאטה? האם הוא מפעיל מערכת ניהול תוכן דיגיטלי? מה לגבי טיפול בנתוני תצורה, רישום מלאי או מידע על עסקאות?
אם הנתונים צריכים להיות מאוחסנים בצורה כזו המאפשרת גישה אליהם, כנראה שיש צורך במסד נתונים רציני.
אילו סוגים של בסיסי נתונים קיימים היום?
בסיסי נתונים מסווגים בדרך כלל לשישה תת-סוגים: בסיסים אנליטיים, מחסני נתונים, מסדי נתונים מבוזרים, מסדי נתונים של משתמשי קצה, מסדי נתונים חיצוניים ותוכנות מסד נתונים תפעולי.
- Analytical Database Software – מסד נתונים המאפשר למשתמש למשוך נתונים ממגוון מאגרי מידע ולבחון אותם לצורך הערכה כמותית של ביצועים (עסקיים, מחלקתיים, עובדים וכו’).
- Data Warehouse Software – מסד נתונים המאפשר למשתמש למשוך נתוני מפתח ממגוון מסדי נתונים ולאחסן אותם במיקום מרכזי לצורך הפקת תובנות קריטיות ודיווח על תובנות אלו. מחסן נתונים זה ישמש את הגורם הרלוונטי במקביל לבסיס נתונים מקורי ולא יפריע לתפקוד בסיסי נתונים ליבה של הארגון.
- Distributed Database Software – מסד נתונים מבוזר כולל מערכת ניהול מרכזית השולטת במידע המאוחסן במגוון מיקומים (כולל ענן, או שרת רשת). מודל מבוזר נחשב לעתים קרובות הבטוח ביותר בגלל יכולת לשמור עודפי מידע (מידע שמוכפל כמה פעמים).
- End User Database Software – מסד נתונים של משתמשי הקצה, כגון Microsoft Excel וגיליונות אלקטרוניים אחרים המותקנים מקומית על המחשב של המשתמש ומספקים את הנתונים שרלוונטיים רק לו.
- External Database Software – מסד נתונים חיצוני הנגיש למגוון רחב של משתמשים, לעתים קרובות באמצעות האינטרנט (למשל מסד נתונים בענן).
- Operational Database Software – מסד נתונים תפעולי המשמש לצרכים תפעוליים המאפשר למשתמש לשנות נתונים בזמן אמת (למטרות כגון ניהול פיננסי וניהול קשרי לקוחות).
בהתאם למבנה מסד נתונים, מודל הנתונים, מקורות הנתונים, והשימוש המיועד – מערכות שונות צפויות להיות מתאימות יותר או פחות לצרכים הארגוניים (או האישיים).
מנגנון הסכימה או השאילתה הנדרשים, דרישות עקביות או זמן אחזור, או אפילו מהירות הטרנזאקציה (כולל בזמן אמת), יכולות להשפיע גם על ההחלטה בבחירת סוג בסיס נתונים.
אז איפה מתחילים בבחירת מסד נתונים?
אחד ההיבטים החשובים שיש להתייחס אליו הוא סיווג מסדי נתונים לפי שתי קטגוריות עיקריות: מסדי נתונים רלציוניים (Relational Database) ולא רלציוניים (Non-Relational Database).
בסיסי נתונים רלציונים – RDBMS
בסיסי נתונים רלציונים (יחסיים) בנויים מטבלאות כאשר כל טבלה מכילה מידע על ישות מסוימת. לדוגמא במערכות בנקאיות בסיסי נתונים רלציונים יכללו טבלאות של נתונים על לקוחות הבנק.
בכל טבלה יהיה ניתן למצוא את מספר הזיהוי של הלקוח (כמו תעודת הזהות שלו) וכך על ידי הקלדת מספר הזיהוי יהיה ניתן לשלוף את כל המידע המקושר בטבלה המזוהה.
המאפיין המגדיר את מסדי נתונים יחסיים הוא הסכימות. סכימות מגדירות קשרים בין ישויות ועיצוב בתוך רשומות תואמות. לדוגמה, סכימה עשויה לציין שבחנויות יש מכירות ולמכירות יש תאריכים, אשר באים לידי ביטוי באמצעות yyyymddd.
בבסיסי נתונים כאלה כל יחידת מידע נקראת “שדה”, ולרוב מגבילים אותו כדי לוודא שיוקלדו בו נתונים רלוונטיים. לדוגמא, שדה של תעודת זהות יוגבל ל-9 ספרות ללא אותיות, ובשדה של שם תהיה הגבלה לאותיות בלבד, ללא מספרים.
ניתן לבצע בבסיס הנתונים קישור בין טבלאות שונות. לדוגמא, במרשם האוכלוסין ניתן למצוא תחת תעודת הזהות של אחד ההורים גם את הטבלאות של הילדים.
שלמות הנתונים היא הדאגה העיקרית במסדי נתונים רלציוניים, ו- RDBMS משתמשים במספר אילוצים כדי לוודא שהנתונים הכלולים בטבלאות אכן מהימנים ומדויקים.
קיימים סוגים רבים של בסיסי נתונים רלציונים, כאשר הנפוצים ביותר ביניהם הם Microsoft SQL Server, MySQL, Oracle, DB2, PostgreSQL. נעבור עליהם בקצרה:
– Oracle
- מסד הנתונים הנפוץ ביותר בארגונים גדולים. גרסאות שלו כוללים מספר ואות, למשל 12c-אות c פירושה מחשוב ענן.
- תומך במספר מערכות הפעלה: Windows, UNIX, ו- Linux.
- כלי מאובטח, השואף לתפוס כמה שפחות שטח, תומך מסדי נתונים גדולים, ומפחית את זמן המעבד כדי לעבד נתונים.
- עלות: זהו כלי מסחרי – רשיונות יקרים, מיועד בעיקר לארגוני Enterprise כמו ארגונים פיננסיים.
– MySQL
- בסיס נתונים המבוסס על שפת SQL.
- תומך במערכות הפעלה: Windows, UNIX, ו- Linux.
- בעל מהירות גבוהה של עיבוד נתונים.
- עלויות: זהו כלי מסחרי מאז שנרכש ע”י חברת אורקל. אך קיימת גם גרסא חינמית במסגרת שימוש בטכנולוגיות קוד פתוח.
– Microsoft SQL Server
- בסיס נתונים התומך במגוון רחב של עיבודי טרנזקציות, מגיע עם חבילה של כלי בינה עסקית (BI) ומאפשר שימוש ביישומי ניתוח נתונים (כגון אקסל, אקסס, PowerBI).
- פותח בשנת 1989. ומאז כמעט כל שנה יוצאת גרסא חדשה.
- עובד על מערכות ההפעלה Windows אבל גם Linux.
- תואם סביבת Oracle, מספק ניהול יעיל של עומסי העבודה ומאפשר למשתמשים מרובים להשתמש באותו מסד נתונים.
- עלויות: זהו כלי מסחרי של חברת מיקרוסופט ונמצא בשימוש רחב מאוד בחברות קטנות וגדולות.
– PostgreSQL
- מסד נתונים עם דגש על יכולת הרחבה ותאימות לתקנים.
- עובד על מערכות ההפעלה Windows ו- Linux.
- נחשב לבסיס נתונים מאוד מאובטח, יכולת אחזור נתונים מהירה מאוד, שיתוף נתונים באמצעות לוחות מחוונים, מהיר יותר מאשר בבסיסי נתונים אחרים.
- עלויות: זהו כלי קוד פתוח.
– DB2
- DB2 – בסיס הנתונים של חברת IBM – הוא RDBMS שנועד לאחסן, לנתח ולאחזר נתונים ביעילות.
- עובד על מערכות ההפעלה Windows ו- Linux.
- קל מאוד להתקנה ולהגדרת נתונים באופן נגיש, ניתן לשמור את כמות עצומה של נתונים כמעט עד פטאבייט – pet bytes.
- עלויות: זהו כלי מסחרי של חברת IBM.
בסיסי נתונים לא רלציוניים – NoSQL
בסיסי נתונים אלה הם בסיסים בעלי נפחים גדולים, השומרים מידע בכמויות עצומות, הנכנס במהירות גבוהה מאוד.
לפרטים על מסלול הכשרה במוביל בתחום Big Data – לחצו Big Data Engineer
מידע זה אינו מאורגן לפי שיטה כלשהי (Unstructured), הוא מגוון מאוד ולא ניתן לסדר אותו בטבלאות. דוגמאות לסוגי נתונים כאלה הינן: לייקים ושיתופים ברשתות חברתיות, תגובות של גולשים, תמונות, מידע מסנסורים במכשור טכנולוגי מתקדם ועוד. מידע מסוג כזה הינו מידע שמעמיד כל ארגון בפני אתגר Big Data. מסדי נתונים שבאים כפתרון מכונים בשם משותף – NoSQL.
מסדי נתונים NoSQL הופיעו כחלופה פופולרית למסדי נתונים רלציוניים כאשר יישומי אינטרנט הפכו למורכבים יותר ויותר.
ההבדל הקריטי בין RDBMS לבין NoSQL בכך שמסדי נתונים רלציוניים מגדירים באופן ברור את הדרך בה כל הנתונים שהוכנסו למסד הנתונים חייבים להיות מוקלדים ומורכבים, ואילו מסדי נתונים של NoSQL מבוססים סכימת הנתונים בכל צורה שהיא, ומאפשרים לאחסן ולטפל בנתונים בלתי מובנים ומובנים למחצה.
בסיסי נתונים NoSQL מתחלקים לכמה משפחות עיקריות, כאשר כל אחת מאופיינת במטרות וביצועים שונים.
Key-Value Stores
לדוגמא: Redis ו- Amazon DynamoDB, הן מערכות פשוטות לניהול מסדי נתונים המאחסנות זוגות של ערכי מפתח ומספקות פונקציונליות בסיסית לאחזור הערך המשויך למפתח ידוע.
הפשטות בשמירת נתונים באופן הזה הופכת את מערכות למותאמות היטב ל-Embedded Databases, כאשר הנתונים המאוחסנים אינם מורכבים במיוחד ומהירותם היא בעלת חשיבות עליונה.
Column-Oriented Databases
לדוגמא: Parquet, MariaDB ו- HBase, הן מערכות המאפשרות למשתמשים לאחסן נתונים במשפחות של עמודות או טבלאות, שורה אחת יכולה להיחשב כרשומה בפני עצמה כך שיש כאן Key-Value Stores רב מימדי. פתרונות אלה מתוכננים במטרה להרחיב את קנה המידה של ניהול הנתונים על פני מספר רב של שרתים במערכת מסיבית ומבוזרות.
Document Stores
לדוגמא: MongoDB ו- Couchbase, הן מערכות שלא בנויות על סכימה אלא מאחסנות נתונים בצורה של מסמכים. מסדי נתונים אלה דומים לקודמים, אך כאן המסמך הוא המפתח והתוכן של המסמך, באשר הוא, הוא הערך.
Graph Databases
לדוגמא: Neo4J ו- GraphDB, בנויים על סכימה שמכילה קשרים בין נתונים ובין אובייקטים במטרה להציג את הנתונים ואת הניתוח באמצעות גרפים חזותיים. מסדי נתונים גרפיים משמשים בדרך כלל כאשר המטרה היא לנתח נתונים שעל פניו לא קשורים אחד לשני על מנת לזהות דפוס התנהגותי מסוים, כגון הונאה.
Search Engines
לדוגמא: Elasticsearch, Splunk, שמטרתם לאחסן נתונים באמצעות מסמכים ללא סכימה ולחיפוש באמצעות תוכן, המשתמשים באינדקסים כדי לסווג את המאפיינים הדומים בין נתונים ולהקל על יכולת החיפוש.
מה התפקיד של מנהלי בסיסי הנתונים?
תפקידם של מנהלי בסיס נתונים הינו לנהל את כל מאגרי המידע העצומים ולהוציא מהם את המידע הדרוש בצורה מסודרת. מנהלי בסיסי נתונים עושים שימוש בכלים מקצועיים ובמערכות מתקדמות, אשר מאפשרות להם להוציא בכל רגע נתון את הנתונים שהם זקוקים להם מתוך בסיסי הנתונים, ולבנות תשתית לשימוש בנתונים ע”י גורמים נוספים בארגון.
מדובר בתפקיד מרכזי בכל ארגון המכיל מערכות מידע. למנהל בסיסי הנתונים אחריות רבה על נושאים רבים הקשורים לניהול מידע הזורם או כבר מאוחסן בבסיסי הנתונים.
DBA עוסק באבטחה, שרידות, ביצועים וזמינות, ובין היתר תפקידו הוא לסייע בפיתוח וכוונון שכבות הקוד האפליקטיבי. למעשה, מידע ונתונים הינם נכסים עיקרים ומרכזיים ביותר בכל ארגון, ולכן תפקידם של אנשי ה-DBA התפתח מאוד והפך להיות מקצוע נחשק ביותר בשוק ההייטק.
מה חשוב לדעת כשבוחרים איפה ללמוד?
בשל העובדה שהיום בסיסי נתונים נמצאים בכל ארגון, אתר אינטרנט או כל מקום אחר, ישנה חשיבות גדולה מאוד לבעלי תפקידים בתחום ניהול בסיסי הנתונים. הכשרה מתאימה יכולה לסייע לכל אחד לבנות קריירה בעולם ההייטק על ידי לימודים מתאימים, ולפתח את עצמו לכיוונים חדשים ולתפקיד רציני לטווח ארוך מאוד, תפקיד שיכול לקדם אותו ולסייע לו להתפתח ולהתקדם לקריירה מצליחה מאוד.
אז קודם כל, בחרו במכללה בעלת נסיון והתמחות בתחום, שבוגריה כבר מצאו עבודה ויכולים להמליץ לכם עליה. בדקו את הסילבוס, את מתכונת הלימודים, את רמת החומרי הלימוד ואת הסיוע שהמכללה מעניקה לבוגריה במציאת עבודה. וודאו שהמכללה ממוקמת באופן מרכזי ונגיש ושהיא מאפשרת לימודים היברידיים, מהכיתה ומהבית. והכי חשוב, בדקו מי הם המדריכים, האם הם מגיעים מעולם בסיסי הנתונים והאם הם עובדים בתחום. לא פחות חשוב שרק לימודים מעשיים הכוללים פרויקטים לאורך המסלול וליווי אישי של מדריכים שמגיעים מהשטח, יכינו אתכם באמת לעבודה.