PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Utilization of alternative data and machine learning applications for credit scoring at the Greek hospitality sector
Alternative Title :Η χρήση εναλλακτικών δεδομένων και εφαρμογών μηχανικής μάθησης στην πιστωτική αξιολόγηση στον ελληνικό ξενοδοχειακό κλάδο
Creator :Γάτος, Νικόλαος
Contributor :Κορφιάτης, Νικόλαος (Επιβλέπων καθηγητής)
Λεκάκος, Γεώργιος (Εξεταστής)
Μούρτος, Ιωάννης (Εξεταστής)
Type :Text
Extent :59σ.
Language :el
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9597
Abstract :Credit scoring refers to the models and procedures that lenders use to determine whether or not to approve a credit or a loan. Credit scoring systems measure the risk of consumer's lending but not their credit. To make these judgments, several strategies and models based on statistical models are employed, and these techniques must be capable of making very accurate predictions which are important for both the lender and the borrower as they determine the equilibrium of money cost. One of the purposes of the credit scoring systems is to forecast the value of a binary variable that indicates whether a consumer will fail to pay back the loan he received or not. Until recently, the most used approach to make such a prediction, was Logistic Regression, however in recent years, Machine Learning methods have been employed to improve the accuracy of the predictions and calculate the Probability to Default (PD). The old- fashioned model also works mainly with financial data that are being collected from the financial institutions – lenders from previous loans and thus it is based on the historical financial behavior of the borrower. The problem that this system is causing, is that borrowers that do not have any financial loan precedent, are very difficult to be scored by the traditional credit scoring models.The scope of this master thesis is to search, concentrate, prepare, produce and process a dataset of alternative data, by the meaning of not strictly defined financial data of businesses that operate at the hotel -hospitality sector in Greece and then use this dataset in order to test it using Machine Learning models with the goal to develop knowledge for a better credit scoring methods than the traditional statistical technique of Logistic Regression. The outcomes will be used from the Credit Bureau, Tiresias Banking Systems S.A. in order to enhance the databases of the company with alternative data on the specific sector and the knowledge of the Machine Learning models will set comparison measures to the existing traditional models.For the creation of the dataset that it was later analyzed, there have been used web scrapping techniques, at the site of Hellenic Chamber of Hotels. From this site there were collected qualitative and quantitative data, which later were used as alternative data, by the meaning of non-strictly connected financial data, to train some Machine Learning models.
Η πιστοληπτική αξιολόγηση αναφέρεται στα μοντέλα και τις διαδικασίες που χρησιμοποιεί ένας δανειστής για να καθορίσει εάν θα εγκρίνουν ή όχι μια πίστωση ή ένα δάνειο. Τα συστήματα βαθμολόγησης πιστοληπτικής ικανότητας μετρούν τον κίνδυνο δανεισμού των καταναλωτών αλλά όχι την πίστωσή τους. Για να γίνουν αυτές οι αξιολογήσεις, χρησιμοποιούνται διάφορες στρατηγικές και μοντέλα που βασίζονται σε στατιστικά μοντέλα, και αυτές οι τεχνικές πρέπει να είναι ικανές να κάνουν πολύ ακριβείς προβλέψεις που είναι σημαντικές τόσο για τον δανειστή όσο και για τον δανειολήπτη καθώς καθορίζουν την ισορροπία του κόστους χρήματος. Ένας από τους σκοπούς των συστημάτων βαθμολόγησης πιστοληπτικής ικανότητας είναι η πρόβλεψη της τιμής μιας δυαδικής αναγνώρισης που υποδεικνύει εάν ένας καταναλωτής θα αποτύχει να αποπληρώσει το δάνειο που έλαβε ή όχι. Μέχρι πρόσφατα, η πιο χρησιμοποιούμενη προσέγγιση για την πραγματοποίηση μιας τέτοιας πρόβλεψης ήταν η λογιστική παλινδρόμηση, ωστόσο τα τελευταία χρόνια έχουν χρησιμοποιηθεί μέθοδοι Μηχανικής Μάθησης για τη βελτίωση της ακρίβειας των προβλέψεων και τον υπολογισμό της πιθανότητας αθέτησης (PD). Το παραδοσιακό μοντέλο λειτουργεί επίσης κυρίως με οικονομικά στοιχεία που συλλέγονται από τα χρηματοπιστωτικά ιδρύματα – δανειστές από προηγούμενα δάνεια και επομένως βασίζεται στην ιστορική οικονομική συμπεριφορά του δανειολήπτη. Το πρόβλημα που προκαλεί αυτό το σύστημα είναι ότι οι δανειολήπτες που δεν έχουν προηγούμενο χρηματοοικονομικών δανείων είναι πολύ δύσκολο να βαθμολογηθούν από τα παραδοσιακά μοντέλα πιστωτικής βαθμολόγησης.Σκοπός της παρούσας μεταπτυχιακής διατριβής είναι η αναζήτηση, συγκέντρωση, προετοιμασία, παραγωγή και επεξεργασία ενός συνόλου δεδομένων εναλλακτικών δεδομένων, με την έννοια των μη αυστηρά καθορισμένων οικονομικών δεδομένων των επιχειρήσεων που δραστηριοποιούνται στον τομέα των ξενοδοχείων - φιλοξενίας στην Ελλάδα και στη συνέχεια να χρησιμοποιηθεί αυτό το σύνολο δεδομένων προκειμένου να τεσταριστεί χρησιμοποιώντας μοντέλα μηχανικής μάθησης με στόχο την ανάπτυξη γνώσεων για καλύτερες μεθόδους βαθμολόγησης πιστοληπτικής ικανότητας από αυτήν της παραδοσιακή στατιστική τεχνικής της λογιστικής παλινδρόμησης. Τα αποτελέσματα θα χρησιμοποιηθούν από την εταιρεία πιστωτικών αξιολογήσεων «Τραπεζικά Συστήματα Πληροφοριών Τειρεσίας Α.Ε.» . προκειμένου να ενισχυθούν οι βάσεις δεδομένων της εταιρείας με εναλλακτικά δεδομένα για τον συγκεκριμένο κλάδο και η γνώση των μοντέλων μηχανικής μάθησης να θέσει νέα μέτρα σύγκρισης για τα υπάρχοντα παραδοσιακά μοντέλα.Για τη δημιουργία του συνόλου δεδομένων που αναλύθηκε αργότερα, χρησιμοποιήθηκαν τεχνικές διάλυσης ιστού, στον χώρο του Ξενοδοχειακού Επιμελητηρίου Ελλάδος. Από αυτόν τον ιστότοπο συλλέχθηκαν ποιοτικά και ποσοτικά δεδομένα, τα οποία αργότερα χρησιμοποιήθηκαν ως εναλλακτικά δεδομένα, με την έννοια των μη αυστηρά συνδεδεμένων οικονομικών δεδομένων, για την εκπαίδευση ορισμένων μοντέλων μηχανικής μάθησης.
Subject :Πιστωτική αξιολόγηση
Εναλλακτικά δεδομένα
Ξενοδοχεία
Μοντέλα μηχανικής εκμάθησης
Credit scoring
Alternative data
Hospitality sector
Machine learning
Date Available :2022-07-20 09:47:15
Date Issued :07/20/2022
Date Submitted :2022-07-20 09:47:15
Access Rights :Free access
Licence :

File: Gatos_2022.pdf

Type: application/pdf