סוגים של בסיסי נתונים

מה התפקיד של בסיסי הנתונים? מהן הטכנולוגיות הרלוונטיות, מהם בסיסי נתונים רלציונים ואילו סוגים נוספים קיימים?

בסיסי נתונים, Database, משמשים היום כמאגר המידע העיקרי והחשוב ביותר בכל ארגון. מדובר במערכת אשר כוללת את כל המידע שהארגון זקוק לו, בין אם זה מידע על הלקוחות, על הספקים ועל העובדים, נתוני מלאי, מכירות ועוד – כל מידע הקשור לפעילות הארגון נמצא בתוך אותם בסיסי נתונים.

בסיסי הנתונים מאפשרים לנו להפיק דוחות המתבססים על אותם נתונים, כמו דוחות מכירות, דוחות מלאי, שעות עבודה של עובדים, מידע על לקוחות או כל דבר אחר. כמו כן בסיסי נתונים פועלי באינטגרציה מלאה עם מערכות נוספות בארגון כך שבכל רגע נתון מספקות מידע רלוונטי.

מבחינה טכנולוגית, בסיס נתונים הוא כלי/תוכנה שמאחסן את המידע, מנהל אותו, מאפשר שליפה לצרכים שונים, בדיקה ועדכון של חלקים מסוימים של מידע באופן מהיר וקוהרנטי – DBMS – database management system.

בסיסי נתונים בתחום Big Data

לדוגמא גולש באתר אינטרנט של חברת מוצרים שמעוניין לבדוק מהם המוצרים שיש לחברה בקטגוריה מסוימת והמחירים – בקליק אחד מקבל את כל המידע שביקש. למעשה מאחורי הקלעים פעל בסיס נתונים שסיפק את המידע על פי הבקשה (הקלקה על שדה כלשהו באתר החברה) של הגולש.

כשמדובר בחברה קטנה, או איש מקצוע בעל עסק פרטי, או אפילו המחשב האישי שלנו – גם כלים כמו אקסל או אקסס – הינם בסיסי נתונים. גיליונות אלקטרוניים הם סוג של מסד נתונים שבו הנתונים מאוחסנים בגיליון אחד או יותר.

בתוך גליונות עבודה, הנתונים מאורגנים בעמודות ובשורות בתוך התאים. כלומר המידע שנמצא בהם – מאורגן ומסודר לפי הגיון מסוים.

כשמדובר בארגונים גדולים יותר עם כמויות נתונים גדולים, כאשר הצרכים הארגוניים דורשים שימוש בכלים וטכנולוגיות מורכבים , גדולים וחזקים יותר – נראה שימוש במסדי נתונים מאסיביים יותר ועל זה נדבר בהמשך. אבל בואו נפרט את המצבים בהם הארגון מבין שיש לו צורך בבסיס נתונים “כבד” יותר.

האם הארגון מאחסן נתונים ממכשירי IoT (“אינטרנט של דברים”) או נתונים עתק (Big Data)? האם מפעיל מערכת ניהול תוכן דיגיטלי? מה לגבי טיפול בנתוני תצורה, או רישום מלאי או מידע על עסקאות? או אולי יש צורך להתמודד עם כמעט כל מערכת אחרת טיפול או יצירת נתונים? אם הנתונים צריים להיות מאוחסנים בצורה כזו שצריך לגשת אליהם, ברור שיש צורך במסד נתונים רציני.

אילו סוגים של בסיסי נתונים קיימים היום?

בסיסי נתונים מסווגים בדרך כלל לשישה תת-סוגים: אנליטיים, מחסני נתונים, מסדי נתונים מבוזרים, מסדי נתונים של משתמשי קצה, מסדי נתונים חיצונית ותוכנות מסד נתונים תפעולי.

  • Analytical database software – מאפשר למשתמש למשוך נתונים ממגוון מאגרי מידע ולבחון אותם לצורך הערכה כמותית של ביצועים (עסקים, מחלקתיים, עובדים וכו’).
  • Data warehouse software – מאפשר למשתמש למשוך נתוני מפתח ממגוון מסדי נתונים ולאחסן אותו במיקום מרכזי לצורך הפקת תובנות קריטיות ודיווח על תובנות אלו. מחסן נתונים זה ישמש את הגורם הרלוונטי במקביל לבסיס נתונים מקורי ולא יפריע לתפקוד שלו.
  • Distributed database software – בסיס נתונים מבוזר כולל מערכת ניהול מרכזית השולטת במידע המאוחסן במגוון מיקומים (כולל ענן, או שרת רשת). מודל מבוזר נחשב לעתים קרובות הבטוח ביותר בגלל יכולת לשמור עודפי מידע (מידע שמוכפל כמה מפעמים).סוגים של בסיסי נתונים
  • End user database software – מסד נתונים של משתמשי הקצה מאחסן מידע המשמש בעיקר אדם אחד, כגון Microsoft Excel וגיליונות אלקטרוניים אחרים.
  • External database software – מסד נתונים חיצוני חייב להיות נגיש למגוון רחב של משתמשים, לעתים קרובות באמצעות האינטרנט (למשך מסד נתונים בענן).
  • Operational database software – תפעולי מאפשרת למשתמש לשנות נתונים בזמן אמת (למטרות כגון ניהול פיננסי וניהול קשרי לקוחות).

בהתאם לסוג, המבנה, מודל הנתונים, מאגר הנתונים, והשימוש המיועד – מערכות שונות צפויות להיות מתאימות יותר או פחות לצרכים הארגוניים (או האישיים).

מנגנון הסכימה או השאילתה הנדרשים, דרישות עקביות או זמן אחזור, או אפילו מהירות הטרנזקציה (כולל בזמן אמת), יכולות להשפיע גם על החלטתה בבחירת סוג בסיס נתונים. אז איפה מתחילים בבחירת מסד נתונים?

אחד ההיבטים החשובים שיש להתייחס אליו הוא סיווג מסדי נתונים לפי שתי קטגוריות עיקריות: מסדי נתונים רלציוניים (relational database) ולא רלציוניים (non-relational database).

בסיסי נתונים רלציונים – RDBMS

בסיסי נתונים רלציונים בנויים מטבלאות, וכל טבלה מכילה מידע על ישות מסוימת. לדוגמא במערכות בנקאיות, בסיסי נתונים רלציונים יכללו טבלאות של נתונים על לקוחות הבנק.

בכל טבלה יהיה ניתן למצוא את מספר הזיהוי של הלקוח (כמו תעודת הזהות שלו) וכך, על ידי הקלדת מספר הזיהוי יהיה ניתן לשלוף את כל המידע המקושר בטבלה המזוהה.

המאפיין המגדיר את מסדי נתונים יחסיים הוא הסכימות. סכימות מגדירות קשרים בין ישויות ועיצוב בתוך רשומות תואמות. לדוגמה, סכימה עשויה לציין שבחנויות יש מכירות ולמכירות יש תאריכים, אשר באים לידי ביטוי  באמצעות yyyymddd.

בבסיסי נתונים כאלה כל יחידת מידע נקראת “שדה”, ולרוב מגבילים אותו כדי לוודא שיוקלדו בו נתונים אמיתיים. לדוגמא, שדה של תעודת זהות יוגבל ל-9 ספרות ללא אותיות, ובשדה של שם תהיה הגבלה לאותיות בלבד, ללא מספרים.

ניתן לבצע בבסיס הנתונים קישור בין טבלאות שונות. לדוגמא, במרשם האוכלוסין ניתן למצוא תחת תעודת הזהות של אחד ההורים גם את הטבלאות של הילדים.

שלמות הנתונים היא הדאגה העיקרית במסדי נתונים רלציוניים, ו- RDBMS משתמשים במספר אילוצים כדי לוודא שהנתונים הכלולים בטבלאות אכן מהימנים ומדויקים.

קיימים סוגים רבים של בסיסי נתונים רלציונים, כאשר הנפוצים ביותר ביניהם הם Microsoft SQL Server, MySQL, Oracle, DB2, PostgreSQL. נעבור עליהם בקצרה:

12c 

  • מסד הנתונים הנפוץ ביותר בגרסתו העדכנית 12c כאשר c פירושו מחשוב ענן.
  • הוא תומך במספר מערכות הפעלה: Windows, UNIX, ו- Linux.
  • מדובר בכלי מאובטח, עם שאיפה לתפוס כמה שפחות שטח, תומך מסדי נתונים גדולים, ומפחית את זמן המעבד כדי לעבד נתונים.
  • עלות: זהו כלי מסחרי – רשיונות יקרים, מיועד בעיקר לארגוני Enterprise, ארגונים פיננסיים.

SQL

  • בסיס נתונים המבוסס על שפת SQL.
  • הוא תומך במערכות הפעלה: Windows, UNIX, ו- Linux.
  • בעל מהירות גבוהה של עיבוד נתונים, שימוש בטריגרים מגדיל את היעילות שלו, ותכונות נוספות.
  • עלויות: זהו כלי מסחרי מאז שנרכש ע”י חברת אורקל. אך קיימת גם גרסא חינמית במסגרת שימוש בטכנולוגיות קוד פתוח.

SQL server

  • בסיס נתונים התומך במגוון רחב של עיבודי טרנזקציות, מגיע עם חבילה של כלי בינה עסקית (BI) ומפאשר שימוש ביישומי ניתוח נתונים (כגון אקסל, אקסס, PowerBI).
  • שפותח בשנת 1989. הגירסה המעודכנת ביותר הגיעה בשנת 2016.
  • עובד על מערכות ההפעלה Windows ו- Linux.
  • תואם עם סביבה של Oracle, מספק ניהול יעיל של עומסי העבודה ומאפשר למשתמשים מרובים להשתמש באותו מסד נתונים.
  • עלויות: זהו כלי מסחרי.

postgre sql

  • עם דגש על יכולת הרחבה ותאימות לתקנים.
  • עובד על מערכות ההפעלה Windows ו- Linux.
  • נחשב לבסיס נתונים מאוד מאובטח, יכולת אחזור נתונים מהירה מאוד, שיתוף נתונים באמצעות לוחות מחוונים הוא מהיר יותר מאשר בבסיסי נתונים אחרים.
  • עלויות: זהו כלי קוד פתוח.

IBM

  • DB2 – בסיס הנתונים של חברת IBM – הוא RDBMS שנועד לאחסן, לנתח ולאחזר נתונים ביעילות.
  • עובד על מערכות ההפעלה Windows ו- Linux.
  • קל מאוד להתקנה ולהגדרת נתונים באופן נגיש, ניתן לשמור את כמות עצומה של נתונים כמעט עד פטאבייט – pet bytes.
  • עלויות: זהו כלי מסחרי.

בסיסי נתונים לא רלציוניים – NoSQL

מדובר במסד נתונים בעל נפחים גדולים, השומר מידע בכמויות עצומות, הנכנס במהירות גבוהה מאוד.

מידע זה אינו מאורגן לפי שיטה כלשהי (Unstructured), הוא מגוון מאוד כך שלא ניתן לסדר אותו בטבלאות. דוגמאות לסוגי מידע שכאלה הינם: לייקים ושיתופים ברשתות חברתיות, תגובות של גולשים, תמונות, מידע מסנסורים במכשור טכנולוגי מתקדם ועוד. מידע מסוג כזה הינו מידע שמעמיד כל ארגון בפני אתר Big Data. מסדי נתונים שבאים כפתרון מכונים בשם משותף – NoSQL.

מסדי נתונים NoSQL הופיעו כחלופה פופולרית למסדי נתונים רלציוניים כאשר יישומי אינטרנט הפכו למורכבים יותר ויותר.

ההבדל הקריטי בין מסדי נתונים של NoSQL ומסדי נתונים רלציוניים הוא שתוכניות RDBMS מגדירות באופן נוקשה את האופן שבו כל הנתונים שהוכנסו למסד הנתונים חייבים להיות מוקלדים ומורכבים, ואילו מסדי נתונים של NoSQL מבוססים סכימת הנתונים בכל צורה שהיא, ומאפשרים לאחסן ולטפל בנתונים בלתי מובנים ומובנים למחצה.

בסיסי נתונים NoSQL מתחלקים לכמה משפחות עיקריות, כאשר כל אחת מאופיינת במטרות וביצועים שונים.

Key-Value Stores

לדוגמא: Redis ו- Amazon DynamoDB, הן מערכות פשוטות לניהול מסדי נתונים שמאחסנות זוגות של ערכי מפתח ומספקות פונקציונליות בסיסית לאחזור הערך המשויך למפתח ידוע.

 הפשטות בשמירת נתונים באופן הזה הופכת את מערכות ניהול מסדי נתונים אלה למותאמות היטב ל-embedded databases, כאשר הנתונים המאוחסנים אינם מורכבים במיוחד ומהירותם היא בעלת חשיבות עליונה.

Wide Column Stores

לדוגמא: Cassandra, Scylla ו- HBase, הן מערכות המאפשרות למשתמשים לאחסן נתונים במשפחות של עמודות או טבלאות, שורה אחת יכולה להיחשב כרשומה בפני עצמה כך שיש כאן Key-Value Stores רב מימדי. פתרונות אלה מתוכננים במטרה להרחיב את קנה המידה של ניהול הנתונים על פני מספר רב של שרתים במערכת מסיבית ומבוזרות.

Document Stores

לדוגמא: MongoDB ו- Couchbase, הן מערכות שלא בנויות על סכימה אלא מאחסנות נתונים בצורה של מסמכים. מסדי נתונים אלה דומים לשניים הקודמים, אך כאן המסמך הוא המפתח והתוכן של המסמך, באשר הוא, הוא הערך.

Graph Databases

דוגמא: Neo4J ו- Datastax Enterprise Graph, בנויים על סכימה שמכילה קשרים בין נתוים ובין אובייקטים במטרה להציג את הנתונים ואת הניתוח באמצעות גרפים חזותיים. מסדי נתונים גרפיים משמשים בדרך כלל כאשר המטרה לנתח נתונים שעל פניו לא קשורים אחד לשני על מנת לזהות דפוס התנהגותי מסוים, כגון מניעת הונאה.

Search Engines

לדוגמא: Elasticsearch, Splunk ו- Solr, שמטרתם לאחסן נתונים באמצעות מסמכים ללא סכימה. הם דומים ל-Document Stores, אך עם דגש רב יותר על הפיכת הנתונים הלא מובנים לנגישים בקלות באמצעות חיפושים מבוססי טקסט עם מחרוזות בעלות מורכבות משתנה.

מה התפקיד של מנהלי בסיסי הנתונים?

היום ארגונים רבים, בעיקר ארגונים גדולים, מחזיקים מנהלי בסיסי נתונים אשר התפקיד שלהם הוא לנהל את כל מאגר המידע העצום הזה ולהוציא ממנו את המידע הדרוש בצורה מסודרת. מנהלי בסיסי נתונים עושים שימוש בכלים מקצועיים ובמערכות מתקדמות, אשר מאפשרות להם להוציא בכל רגע נתון את הנתונים שהם זקוקים להם מתוך בסיסי הנתונים, ולבנות שאילתות לצורך הפקת דוחות מיוחדים על פי הצרכים של הארגון.

מדובר בתפקיד מרכזי בכל ארגון המכיל מערכות מידע. למנהל בסיסי הנתונים אחריות רבה על נושאים רבים הקשורים לניהול מידע הזורם או כבר מאוחסן בבסיסי הנתונים.

DBA עוסק באבטחה, שרידות, ביצועים וזמינות, ובין היתר תפקידו הוא לסייע בפיתוח וכוונון שכבות הקוד האפליקטיבי. למעשה, ניתן לומר שבעולם הטכנולוגי בו אנו חיים, מידע ונתונים הינם נכסים עיקרים ומרכזיים ביותר, ולכן תפקידם של אנשי ה-DBA התפתח מאוד והפך להיות מקצוע נחשק ביותר בשוק ההייטק.

לפרטים על קורס DBA לחצו כאן.

בשל העובדה שהיום בסיסי נתונים נמצאים בכל ארגון, אתר אינטרנט או כל מקום אחר, ישנה חשיבות גדולה מאוד לבעלי תפקידים בתחום ניהול בסיסי הנתונים.

לכן, הכשרה מתאימה יכולה לסייע לכל אחד לבנות קריירה בעולם ההייטק על ידי לימודים מתאימים, ולפתח את עצמו לכיוונים חדשים ולתפקיד רציני לטווח ארוך מאוד, תפקיד שיכול לקדם אותו ולסייע לו להתפתח ולשמור על קריירה מצליחה מאוד.

אם אתם חושבים על פיתוח קריירה בניהול בסיסי נתונים, חשוב שתבחרו במכללה עם ניסיון בתחום, מכללה שאתם יכולים למצוא לא מעט בוגרים שלה שכבר מצאו עבודה בתחום ויכולים לסייע לכם להכיר טוב יותר את המכללה, לדעת יותר על רמת הלימודים שהיא מציעה, על הסיוע שהיא מעניקה לבוגרים במציאת עבודה לאחר הלימודים ועוד.

מה עוד חשוב לדעת?

בידקו היכן נמצאת המכללה והאם יש לכם גישה קלה אליה. ישנן מכללות המאפשרות ללמוד מהבית בלימודי אונליין, וזה מאפשר לסטודנטים גמישות בהגעה למכללה וחיסכון גדול בזמן בימים בהם פחות נוח לצאת מהבית.. התחלת לימודים היא סוג של התחייבות, ותרצו שההגעה תהיה לכם נוחה. חשוב לברר גם את הסדרי החנייה באיזור, על מנת שתעמדו בתקציב שהקצבתם לעצמכם.

כל נתון כזה יכול להיות מהותי עבור הלימודים שלכם ועבור אפיקי הקריירה שתמצאו לאחר מכן.

לכן, אל תתפשרו ובחרו מקום לימודים מקצועי המציע לכם צוות מורים המגיע מתוך עולם בסיסי הנתונים וליווי אישי לאורך כל הלימודים וגם לאחר מכן, ליווי שיאפשר לכם למצוא עבודה ולבנות את הקריירה שלכם תוך קבלת ייעוץ ממומחים בעלי ניסיון רב בתחום.