Abstract : | Η απάτη με πιστωτικές κάρτες παραμένει μια σημαντική πρόκληση για τον τραπεζικό κλάδο, γεγονός που καθιστά αναγκαία την ανάπτυξη ισχυρών συστημάτων ανίχνευσης απάτης. Η παρούσα διπλωματική εργασία εστιάζει στην αξιοποίηση τεχνικών μηχανικής μάθησης χωρίς επίβλεψη για την κατασκευή ενός μοντέλου ανίχνευσης απάτης με πιστωτικές κάρτες. Χρησιμοποιώντας ένα σύνολο δεδομένων που περιλαμβάνει περίπου 5,5 εκατομμύρια συναλλαγές από 10.000 πελάτες της Εθνικής Τράπεζας της Ελλάδος (ΕΤΕ), το έργο χρησιμοποιεί μοντέλα όπως το K-Prototypes και μοντέλα της PyOD για την ανίχνευση ανωμαλιών. Η απουσία επισημασμένων αποτελεσμάτων που υποδεικνύουν απάτη καθιστά αναγκαία τη χρήση μη επιβλεπόμενων μεθόδων, οι οποίες μπορούν να εντοπίσουν δυνητικά ύποπτες συναλλαγές με βάση την απόκλισή τους από τα κανονικά πρότυπα. Η εργασία διερευνά διάφορες τεχνικές για την αξιολόγηση των επιδόσεων των μοντέλων χωρίς ετικέτες για το αποτέλεσμα της συναλλαγής, με στόχο την ανάπτυξη ενός αξιόπιστου συστήματος ανίχνευσης απάτης που μπορεί να βοηθήσει τα χρηματοπιστωτικά ιδρύματα στην προστασία από τέτοιου είδους δραστηριότητες. Τα ευρήματα συμβάλλουν στις συνεχιζόμενες προσπάθειες για την ενίσχυση των μηχανισμών ανίχνευσης απάτης στον τραπεζικό τομέα και αναδεικνύουν τη σημασία της μάθησης χωρίς επίβλεψη στην αντιμετώπιση σύνθετων προκλήσεων όπως οι απάτες πιστωτικών καρτών. Credit card fraud remains a significant challenge in the banking industry, necessitating the development of robust fraud detection systems. This capstone project focuses on leveraging unsupervised learning techniques to build a credit card fraud detection model. Utilizing a dataset comprising approximately 5 million transactions from 10,000 clients of the National Bank of Greece (NBG), the project employs K-Prototypes and PyOD models for anomaly detection. The absence of labeled outcomes indicating fraud necessitates the use of unsupervised methods, which can identify potentially fraudulent transactions based on their deviation from normal patterns. The project explores various techniques for evaluating model performance without ground truth labels, aiming to develop a reliable fraud detection system that can assist financial institutions in safeguarding against fraudulent activities. The findings contribute to the ongoing efforts to enhance fraud detection mechanisms in the banking sector and highlight the importance of unsupervised learning in addressing complex challenges such as credit card fraud.
|
---|