Περίληψη : | Statistical techniques consist credit decision-makers’ tools which are used by the banks and some companies to assess if the customers or loan applicants are capable to repay their obligations. In other words, if the customers are creditworthy or not (“good” or “bad”).In this thesis a German credit dataset is used and with the help of R programming we tried to examine six different statistical methods in order to make the best prediction. Different statistical-classification methods are performed and predict weather a loan applicant is creditworthy or not. Logistic Regression, Linear Discriminant Analysis, Quadratic Discriminant Analysis, K-Nearest Neighbors, Tree Based Methods: Classification trees (Decision Trees) and Random Forest are some statistical methods which are examined in this thesis. Οι στατιστικές μέθοδοι αποτελούν εργαλεία λήψης αποφάσεων των τραπεζών και ορισμένων εταιρειών για να εκτιμήσουν εάν οι πελάτες ή υποψήφιοι δανειολήπτες είναι σε θέση να εξοφλήσουν τις υποχρεώσεις τους. Με άλλα λόγια, εάν οι πελάτες είναι αξιόπιστοι ή όχι ("καλοί" ή "κακοί"). Σε αυτή την διπλωματική εργασία χρησιμοποιείται μία γερμανική βάση πιστωτικών δεδομένων και με τη βοήθεια της R προσπαθήσαμε να εξετάσουμε έξι διαφορετικές στατιστικές μεθόδους με σκοπό να γίνει η καλύτερη πρόβλεψη. Εκτελούνται διαφορετικές στατιστικές μέθοδοι και προβλέπουν κατά πόσο ο πελατης ή υποψήφιος δανειολήπτης είναι αξιόπιστος ή όχι. Οι στατιστικές μέθοδοι που εξετάζονται σε αυτή την διπλωματική εργασία είναι οι εξής: Logistic Regression, Linear Discriminant Analysis, Quadratic Discriminant Analysis, K-Nearest Neighbors, Tree Based Methods: Classification trees (Decision Trees) and Random Forest.
|
---|