הקורס עוסק בטכניקות של הוצאת מסקנות מתוך בסיס נתונים. הטכניקות שייסקרו בקורס הם: שיטות להכנה לניתוח, קביעת חוקי קשר, בניית עץ, סיווג לפי חוק בייס, בניית מקבצים ודנדוגרמים, שיטות מסטטיסטיקה רב-פראמטרית ליניארית, טיפול בטכסטים, לימוד עם מורה, לימוד בעזרת מערכת עיצבית. שלוש בשיטות עם קו תחתון גם ינוסו על בסיס נתונים אמיתי.
העבודה על בסיס נתונים:
כל קבוצה יקבל בסיס נתונים שאותו ינתח במשך הקורס בשיטות שונות. את שיעורי הבית יש להגיש במסמך מודפס ערוך בתובנת Word כאשר הקבוצה חייבת לשמור על העתק אלקטרוני לפחות עד קבלת ציון סופי מהקורס. הקבוצה צריכה גם להתכונן להציג את המשימה השבועית בכיתה. לכן כל קבוצה חייבת לשלוח לפחות נציג אחד לפגישה השבועית. יש לשמור גם את כל הקבצים האחרים המייצגים את הנתונים.
מבוא- הכרת בסיסי נתונים וחלוקתם בין המשתתפים. למידת קשרים והסקת מסקנות מהעץ.
הכנה לניתוח- הכרת שלוש התוכנות מבחינת הקלט, טיפול בנתונים חסרים. מהם סוגי הנתונים, והעברתם לגיליון אקסל.
הכנה לניתוח- שכיחות, ממוצעים וקורלציות. סטטיסטיקות פשוטות מהנתונים.
עץ החלטות- בניית עץ – התוכנה c4.5 – הקלט. עריכת הקלט להתוכנה .c4.5
בניית העץ- תורת האינפורמציה ושימושה בבניה. הרצת התוכנה c4.5 ופירוש התוצאות.
בניית העץ- חוק בייס ושימושה בבניה והסקת כללים. הרצת התוכנה c4.5rules ופירוש התוצאות.
למידת קשרים- למידת קשרים והסקת מסקנות מהעץ. הרצת התוכנות consult, consultr.
רשת עיצבית- הכרת תוכנת NN. הכנת הנתונים לתוכנת NN.
מקבצים- מרחקים. הרצת תוכנת .NN
מרכיבים ראשיים- הכרת תוכנת multDim. הכנת הנתונים לתוכנת multDim.
מקבצים- שיטות אחרות ודנדוגרם. הרצת תוכנת .multDim
טכסטים. השוה את השיטות מבחינת נוחיות של הכנת הקלט ההרצה והבנת הפלט, כוח ניבוי צפוי של הפלט, וכל הערה מעניינת.
שיטות LP.
דרישות הקדם והדרישות המקבילות בקורס כריית ידע ולמידת מכונה הינן:
דרישות קדם: מסדי נתונים (30030).
דרישות מקבילות: אין.
לחצו למעבר אל תוכנית לימודי הנדסת תעשייה וניהול - התמחות במערכות מידע
לחצו למעבר אל תוכנית לימודי הנדסת תעשייה וניהול - התמחות בניהול התפעול
חזרה לעמוד הראשי של הנדסת תעשייה וניהול