Abstract : | Η εργασία αυτή ασχολείται με την ταξινόμηση διαλόγων και εκφωνημάτων (turns) διαλόγων σεκατηγορίες. Αυτοί οι διάλογοι προήλθαν από το τηλεφωνικό κέντρο της εταιρείας KTEO Hellas.Η εταιρεία Pobuca μετέτρεψε τους διαλόγους από προφορικό λόγο σε κείμενο. Η τελευταίαμορφή είναι αυτή στην οποία τα δεδομένα θα υποβληθούν σε επεξεργασία στο σύνολο τουέργου αυτού. Η ανάλυση που ακολουθεί στοχεύει στη δημιουργία 2 τύπων ταξινομητών:• εκείνων που θα προσδιορίσουν την πρόθεση που είχε ο πελάτης πραγματοποιώντας τηνκλήση,• εκείνων που θα κάνουν προβλέψεις για το περιεχόμενο του κάθε εκφωνήματος (turn) τουδιαλόγου.Τα μοντέλα που χρησιμοποιούνται και για τους δύο τύπους ταξινομητών είναι :1. λογιστική παλινδρόμηση (logistic regression),2. ένας ταξινομητής που χρησιμοποιεί ένα ανατροφοδοτούμενο νευρωνικό δίκτυο (recurrentneural network, RNN),3. ένας ταξινομητής βασισμένος σε ένα προ-εκπαιδευμένο ελληνικό μοντέλο BERT. This work deals with automatic classification of dialogues and dialogue turns. These dialoguescame from the the call center of the company KTEO Hellas. The Pobuca company converted thesedialogues from speech to text. The later is the format in which the data will be processed in thiswhole project. The analysis that follows aims to create 2 types of classifiers:• those that will specify the reason why the customer made the call,• those that will make predictions about the content of each turn of the dialogue.The models that were implemented for both types of classifiers are :1. logistic regression,2. a classifier that uses a recurrent neural network (RNN),3. a classifier based on a pre-trained Greek BERT model.
|
---|