Περίληψη : | Σκοπός της παρούσας εργασίας είναι η συμπαγής παρουσίαση της βασικής θεωρίας της βαθιάς μάθησης, η εισαγωγή σε βασικές μεθόδους που απαιτούνται για την χρήση των αλγορίθμων της στην πράξη, καθώς επίσης και η παρουσίαση μιας υπολογιστικής εφαρμογής ταξινόμησης πιστωτικού κινδύνου με χρήση της γλώσσας προγραμματισμού Python. Η εργασία χωρίζεται σε διακριτές θεματικές ενότητες. Αρχικά στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στην βαθιά μάθηση και παρατίθενται ιστορικά στοιχεία και λόγοι που καθιστούν την βαθιά μάθηση ένα δυναμικό εργαλείο για την επίλυση προβλημάτων διαφόρων θεματικών περιοχών. Στο δεύτερο κεφάλαιο αναπτύσσεται η θεωρία και τα κύρια εργαλεία ανάπτυξης των τεχνητών νευρωνικών δικτύων που αποτελούν τον πυρήνα της λειτουργίας των αλγορίθμων της βαθιάς μάθησης. Ως άμεση συνέχεια αυτών, το τρίτο κεφάλαιο αφιερώνεται στην ανάπτυξη των αλγορίθμων βελτιστοποίησης που χρησιμοποιούνται για την εύρεση των βέλτιστων παραμέτρων των μοντέλων βαθιάς μάθησης. Επίσης, περιλαμβάνει ενότητες για την επιλογή υπερπαραμέτρων και την αρχικοποίηση των βαρών στα μοντέλα βαθιάς μάθησης – θέματα ιδιαιτέρως επιδραστικά στην ορθή λειτουργία των μοντέλων. Στο τέταρτο κεφάλαιο αναπτύσσεται μια εφαρμογή για την ταξινόμηση πιστωτικού κινδύνου με την χρήση μοντέλων βαθιάς μάθησης. Παρατίθενται τα δεδομένα που θα χρησιμοποιηθούν και στη συνέχεια δημιουργούνται διάφορα μοντέλα, προκειμένου να γίνει σύγκριση των αποτελεσμάτων τους, να αξιολογηθούν οι επιλογές των διαφορετικών υπερπαραμέτρων και να εξαχθούν συμπεράσματα. The purpose of this paper is a compact presentation of the basic theory of deep learning, the introduction to basic methods required for the use of its algorithms in practice, as well as the introduction of a credit risk classification computing application using the Python programming language. The paper is divided into separate thematic sections. Initially, the first chapter introduces deep learning and presents historical facts and reasons that make deep learning a powerful tool for solving problems in different subject areas. The second chapter develops the theory and the main tools for the development of artificial neural networks that are the core of the operation of deep learning algorithms. As a direct follow-up to this, the third chapter is devoted to the development of optimization algorithms used to find the optimal parameters of deep learning models. It also includes modules for selecting hyperparameters and initializing weights in deep learning models - topics that are particularly influential in the proper functioning of the models. The fourth chapter develops an application for credit risk classification using deep learning models. The data that will be used are presented and then various models are created, in order to compare their results, to evaluate the choices of the different hyperparameters and to draw conclusions.
|
---|