ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη
Συλλογές :

Τίτλος :Fraud detection using NLP features
Εναλλακτικός τίτλος :Ανίχνευση απάτης χρησιμοποιώντας χαρακτηριστικά επεξεργασίας φυσικής γλώσσας
Δημιουργός :Βουλγαράκης, Διονύσιος
Voulgarakis, Dionysios
Συντελεστής :Pavlopoulos, Ioannis (Επιβλέπων καθηγητής)
Stafylakis, Themos (Εξεταστής)
Vassalos, Vasilios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Τύπος :Text
Φυσική περιγραφή :48p.
Γλώσσα :en
Αναγνωριστικό :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11743
Περίληψη :Η άνοδος του διαδικτύου και της χρήσης των κινητών στις τραπεζικές συναλλαγές έχει διευκολύνει σημαντικά τις οικονομικές συναλλαγές, με εκατομμύρια να πραγματοποιούνται καθημερινά. Ωστόσο, οι απατεώνες εκμεταλλεύονται όλο και περισσότερο αυτά τα κανάλια, δημιουργώντας μια κρίσιμη ανάγκη για αυτοματοποιημένα συστήματα ανίχνευσης απάτης. Σε αυτή τη διατριβή, θέτουμε σημείο αναφοράς απόδοσης στο σύνολο δεδομένων FraudNLP, αξιοποιώντας τα δεδομένα API για την καλύτερη κατανόηση και αναγνώριση των απατών. Επιπλέον, η υψηλή ανισορροπία μεταξύ των απατηλών και μη συναλλαγών υπογραμμίζει την ανάγκη δημιουργίας συνθετικών δεδομένων για την αύξηση των απατηλών δειγμάτων. Για να το αντιμετωπίσουμε, εισάγουμε μια νέα προσέγγιση που χρησιμοποιεί τα GANs για τη δημιουργία συνθετικών δεδομένων, βελτιώνοντας την ικανότητα του συστήματος να εντοπίζει αποτελεσματικά της δραστηριότητες των κακόβουλων χρηστών.
The rise of Internet and mobile banking has greatly facilitated financial transactions, with millions occurring daily. However, fraudsters have increasingly exploited these channels, creating a critical need for automated fraud detection systems. In this thesis, we establish performance benchmarks on the FraudNLP dataset, leveraging API call data to better understand and identify fraudulent behavior. Additionally, the high imbalance between fraudulent and non-fraudulent transactions highlights the need for synthetic data generation to increase fraudulent samples. To address this, we introduce a novel approach that employs GANs to generate synthetic data, augmenting this imbalanced dataset and improving the system’s ability to effectively detect fraudulent activities.
Λέξη κλειδί :Επεξεργασία φυσικής γλώσσας
Ανίχνευση απάτης
Συνθετικά δεδομένα
Natural Language Processing (NLP)
Generative adversarial networks (GANs)
Fraud detection
Data augmentation
Διαθέσιμο από :2024-12-01 15:57:41
Ημερομηνία έκδοσης :30-11-2024
Ημερομηνία κατάθεσης :2024-12-01 15:57:41
Δικαιώματα χρήσης :Free access
Άδεια χρήσης :

Αρχείο: Voulgarakis_2024.pdf

Τύπος: application/pdf