Abstract : | Η άνοδος του διαδικτύου και της χρήσης των κινητών στις τραπεζικές συναλλαγές έχει διευκολύνει σημαντικά τις οικονομικές συναλλαγές, με εκατομμύρια να πραγματοποιούνται καθημερινά. Ωστόσο, οι απατεώνες εκμεταλλεύονται όλο και περισσότερο αυτά τα κανάλια, δημιουργώντας μια κρίσιμη ανάγκη για αυτοματοποιημένα συστήματα ανίχνευσης απάτης. Σε αυτή τη διατριβή, θέτουμε σημείο αναφοράς απόδοσης στο σύνολο δεδομένων FraudNLP, αξιοποιώντας τα δεδομένα API για την καλύτερη κατανόηση και αναγνώριση των απατών. Επιπλέον, η υψηλή ανισορροπία μεταξύ των απατηλών και μη συναλλαγών υπογραμμίζει την ανάγκη δημιουργίας συνθετικών δεδομένων για την αύξηση των απατηλών δειγμάτων. Για να το αντιμετωπίσουμε, εισάγουμε μια νέα προσέγγιση που χρησιμοποιεί τα GANs για τη δημιουργία συνθετικών δεδομένων, βελτιώνοντας την ικανότητα του συστήματος να εντοπίζει αποτελεσματικά της δραστηριότητες των κακόβουλων χρηστών. The rise of Internet and mobile banking has greatly facilitated financial transactions, with millions occurring daily. However, fraudsters have increasingly exploited these channels, creating a critical need for automated fraud detection systems. In this thesis, we establish performance benchmarks on the FraudNLP dataset, leveraging API call data to better understand and identify fraudulent behavior. Additionally, the high imbalance between fraudulent and non-fraudulent transactions highlights the need for synthetic data generation to increase fraudulent samples. To address this, we introduce a novel approach that employs GANs to generate synthetic data, augmenting this imbalanced dataset and improving the system’s ability to effectively detect fraudulent activities.
|
---|