Data augmentation techniques for legal text analytics
Φόρτωση...
Ημερομηνία
2017
Συγγραφείς
Papadaki, Maria
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων
Διαθέσιμο από
2017-12-19 14:58:25
Περίληψη
This master thesis involves the implementation and evaluation of the domain-agnostic data augmentation techniques that operate in the input feature space. More concretely, in the context of contract element extraction (Chalkidis et al., 2017a, 2017b), this thesis explores the effectiveness of three domain-agnostic data augmentation methods, namely: adding Gaussian noise, applying interpolation or extrapolation at the word representation level (word embeddings).Αυτή η μεταπτυχιακή εργασία περιλαμβάνει την εφαρμογή και αξιολόγηση των τεχνικών αύξησης δεδομένων που λειτουργούν στο χώρο που δημιουργείται από τα διανύσματα εισόδου. Πιο συγκεκριμένα, στα πλαίσια της εξόρυξης στοιχείων από νομικά συμβόλαια (Chalkidis et al., 2017a, 2017b), αυτή η εργασία εξετάζει την αποτελεσματικότητα τριών μεθόδων αύξησης δεδομένων, δηλαδή: της προσθήκης Gaussian θορύβου και της εφαρμογής interpolation ή extrapolation στο επίπεδο των word embeddings.
Περιγραφή
Λέξεις-κλειδιά
Data augmentation, Legal texts, Αύξηση δεδομένων, Νομικά κείμενα