Machine Learning with Python
בקורס הזה נצלול לפרקטיקה היומיומית של ה-Data Scientist, ובאמצעות use-case-ים שונים ניחשף באופן שיטתי והדרגתי לעולם אינסופי של כלים, שיטות, אתגרים, עקרונות, וכמובן – מודלים סטטיסטיים. נתוודע ל-CRISP-DM, המתודולוגיה המקובלת לפיתוח בעולם ה-Data Science, נבין את השלבים השונים שלה, וניישם אותם בפועל על אוסף רחב של בעיות עסקיות מעולמות תוכן שונים. נכיר לעומק את החבילה הנפוצה ביותר בעולם ה-Machine Learning, הלא היא Scikit-Learn.
בנוסף, במהלך הקורס הסטודנטים יקבלו משימות פרויקט ביניהן פרויקט מסכם, בו יוכל כל סטודנט להתנסות בטכניקות וברעיונות שנלמדו בקורס מול בעיה עסקית אמיתית. על הסטודנטים יהיה להסביר את הבעיה העסקית שנבחרה ואת הנתונים המלווים אותה, להדגים את תהליכי ה-pre-processing וה-feature engineering שלהם, ולהציג את המודלים שבהם בחרו להשתמש בסופו של דבר.
קורס זה מוצע בהנחה מיוחדת “בצל תקופת קורונה”, ויועבר בפורמט אונליין בשידור חי מכל מקום. על כל סטודנט להצטייד בחשבון גוגל על מנת לקבל גישה לחומרי הקורס.
בעלי רקע ב-Data Analysis, BI, פיתוח, מסדי נתונים ומערכות מידע, המעוניינים להעשיר את יכולותיהם בתחום תחקור הנתונים.
ידע ונסיון בשפת Python וכלים לעבודה על נתונים:
- Pre-processing with pandas
- Mathematical packages (scipy, numpy)
- Visualization packages (matplotlib, seaborn)
- Working with data resources (JSON files, databases & web)
בעלי נסיון מאחד או יותר תחומים המתוארים להלן:
- נסיון בניתוח נתונים (אקסל מתקדם, SQL, כלי BI)
בעלי תארים רלוונטיים: מדעי מחשב, מערכות מידע, הנדסה, מדעים מדויקים, מדעי החיים, סטטיסטקיה/מתמטיקה, תעשיה וניהול.
שליטה טובה בשפה האנגלית
Concepts
- Supervised & unsupervised learning
- Pipelines – Transformers & Estimators
- Feature engineering
- Dimensionality reduction
- Model selection – Cross-validation & grid search
- Overfitting & regularization
- Ensemble methods – Voting, bagging & boosting
- Imbalanced data
- Anomaly detection
- Clustering
- Metrics and similarities
- Scoring
- Deep Learning
- Neural networks & MLP
- Implementation with keras
- Important layers (CNN, RNN, autoencoders)
- Advanced architectures
Models
- Linear regression
- Logistic regression
- Decision trees (inc. random forest)
- K-nearest neighbors (k-NN)
- Neural networks
- K-means
- Agglomerative clustering

- טרם נקבע מועד פתיחה
- 09:00-16:30 | ב+ג
ימים ושעות
- 96
שעות אקדמיות
- מתקדם
רמת הקורס
שפת הדרכה
לבדיקת התאמה לקורס
ממליצים
לפתיחה והורדת סילבוס