ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη
Συλλογές :

Τίτλος :A prompting-based encoder-decoder approach to intent recognition and slot filling
Εναλλακτικός τίτλος :Κατανόηση φυσικής γλώσσας με τη χρήση αρχιτεκτονικών κωδικοποιητή-αποκωδικοποιητή βασισμένων στην προτροπή
Δημιουργός :Tassias, Panagiotis
Τασσιάς, Παναγιώτης
Συντελεστής :Androutsopoulos, Ion (Επιβλέπων καθηγητής)
Vassalos, Vasilios (Εξεταστής)
Malakasiotis, Prodromos (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Τύπος :Text
Σημείωση :Capstone project supervisor: Themos Stafylakis (Omilia Ltd))
Φυσική περιγραφή :44p.
Γλώσσα :en
Αναγνωριστικό :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9449
Περίληψη :In recent years, there is an increasing interest in developing advanced conversationalagents that facilitate users to accomplish specific goals. Natural LanguageUnderstanding (NLU), a subfield of Natural Language Processing, is at the core ofthese task-oriented dialogue systems. In this thesis, we experimented with differentways of tackling NLU problems, focusing on the sub-tasks of Intent Recognitionand Slot Filling. By conducting various experiments on the publicly available ATISand SNIPS datasets, we confirm that in cases where there is explicit slot labelalignment, fine-tuning large Language Models like BERT, seems to be the goldstandard approach. However, regarding the Slot Filling problem, in most real-worldcases this method is not feasible due to the absence of human-annotated B-I-O tagsand it additionally performs poorly in few-shot settings, where there is a limitedset of labeled data. In order to overcome these limitations, we propose using anencoder-decoder approach that incorporates the concept of prompting. Specifically,we utilize the T5 Language Model along with natural language templateswhich the model is prompted to fill in with the relevant information. This methodachieves 98% intent accuracy and 95.9% slot micro-F1-score on the SNIPS dataset.More importantly, it provides substantial performance improvements in few-shotsettings and displays great adaptability to different intents and domains, whencompared to its counterpart that does not embody prompts.
Τα τελευταία χρόνια, παρατηρείται αυξανόμενο ενδιαφέρον όσον αφορά στην ανάπτυξη προηγμένων Συστημάτων Διαλόγου, τα οποία διευκολύνουν τους χρήστες να πετύχουν συγκεκριμένους στόχους. Στην καρδιά αυτών των συστημάτων βρίσκεται η Κατανόηση Φυσικής Γλώσσας (ΚΦΓ), ένας υποτομέας της Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ). Στην παρούσα Διπλωματική Εργασία επικεντρωθήκαμε στην αντιμετώπιση προβλημάτων ΚΦΓ με ιδιαίτερη έμφαση στα προβλήματα της Αναγνώρισης Πρόθεσης (Intent Recognition) και Συμπλήρωσης Θυρίδων (Slot Filling). Με τη διενέργεια πειραμάτων, επιβεβαιώσαμε ότι σε περιπτώσεις όπου υπάρχει ευθυγράμμιση στις ετικέτες των θυρίδων, η προσαρμογή μεγάλων Γλωσσικών Μοντέλων, όπως το BERT, αποτελεί την κυρίαρχη προσέγγιση. Ωστόσο, πολύ συχνά σε πραγματικά προβλήματα η προσέγγιση αυτή δεν μπορεί να εφαρμοστεί, διότι τα δεδομένα εκπαίδευσης δεν είναι επισημειωμένα με τις απαραίτητες Β-Ι-Ο ετικέτες και επιπλέον η μέθοδος αυτή δεν αποδίδει καλά σε περιπτώσεις όπου έχουμε ελάχιστα επισημειωμένα δεδομένα εκπαίδευσης. Για την αντιμετώπιση των παραπάνω προβλημάτων προτείνουμε την υιοθέτηση μοντέλων που χρησιμοποιούν την αρχιτεκτονική κωδικοποιητή - αποκωδικοποιητή και ταυτόχρονα αξιοποιούν την έννοια της Προτροπής (prompting). Πιο συγκεκριμένα, χρησιμοποιούμε το Γλωσσικό Μοντέλο T5 παράλληλα με σχεδιότυπα (templates) φυσικής γλώσσας, τα οποία το μοντέλο καλείται να συμπληρώσει με τις σχετικές πληροφορίες. Σε πειράματα που έγιναν στο σύνολο δεδομένων SNIPS, η μέθοδος αυτή προβλέπει την πρόθεση του χρήστη με 98% ακρίβεια και πετυχαίνει 95.9% F1 στην συμπλήρωση θυρίδων. Τέλος, σε σύγκριση με συστήματα που δεν αξιοποιούν υποδείγματα προτροπής, προσφέρει βελτιώσεις στην επίδοση σε καταστάσεις όπου υπάρχει έλλειψη σε επισημειωμένα δεδομένα και επιδεικνύει ιδιαίτερη προσαρμοστικότητα σε διαφορετικές προθέσεις και θεματολογίες.
Λέξη κλειδί :Επεξεργασία φυσικής γλώσσας
Κατανόηση φυσικής γλώσσας
Προτροπή
Natural Language Processing (NLP)
Natural Language Understanding (NLU)
Prompting
Διαθέσιμο από :2022-04-30 15:43:52
Ημερομηνία έκδοσης :12/31/2021
Ημερομηνία κατάθεσης :2022-04-30 15:43:52
Δικαιώματα χρήσης :Free access
Άδεια χρήσης :

Αρχείο: Tassias_2021.pdf

Τύπος: application/pdf