Συλλογές
Τίτλος Γλωσσική μοντελοποίηση για την απόδοση συγγραφικής πατρότητας σε Ομηρικά κείμενα
Εναλλακτικός τίτλος Language modelling for authorship attribution in Homeric texts
Δημιουργός Fasoi, Maria, Φασόη, Μαρία
Συντελεστής Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής
Ανδρουτσόπουλος, Ίων
Κωνσταντινίδου, Μαρία
Παυλόπουλος, Ιωάννης
Τύπος Text
Φυσική περιγραφή 71σ.
Γλώσσα el
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8128
Περίληψη In the present thesis, language models were applied in order to study the authorship attribution of Homeric texts, which according to the prevailing view are attributed to the poet Homer. To achieve this goal, statistical and neural language models were applied, which were trained on the Homeric epics (Iliad and Odyssey) and were rated both in the epics themselves and in the so-called Homeric hymns. The grading was performed on the one hand by automatically measuring the linguistic affinity of a sample of text with the whole linguistic model, on the other hand by classifying excerpts from Homeric texts.In this way, excerpts from ancient texts were found to show more affinity than other excerpts at the linguistic level with the set of training data. More specifically, the rhapsody “Ο” of Iliad with the whole epic of the Iliad and the rhapsody “β” of Odyssey with the total epic of Odyssey. Next, we observed that the rhapsody “δ” of Odyssey shows more linguistic resemblance to the epic of Iliad and respectively the rhapsody “Τ” of Iliad to the epic Odyssey. Then, we studied the linguistic affinity of the Homeric hymns “To Apollo”, “To Aphrodite”, “To Demeter” and “To Hermes” with the Homeric epics and concluded that the hymn “To Aphrodite” shows the greatest linguistic affinity with the Homeric epics. Finally, these linguistic models were contrasted with human-annotators interpretation in order to investigate their ability to classify correctly given excerpts of ancient texts into their respective subordinate work. We conclude that neural language models long short- term memory can classify Homeric texts more successfully in their respective subordinate work than statistical language models and human interpretation.
Στην παρούσα διπλωματική εργασία εφαρμόστηκαν γλωσσικά μοντέλα, ώστε να μελετηθεί η απόδοση συγγραφικής πατρότητας ομηρικών κειμένων, που κατά την κρατούσα άποψη αποδίδονται στον ποιητή Όμηρο. Για την επίτευξη του σκοπού αυτού εφαρμόστηκαν στατιστικά και νευρωνικά γλωσσικά μοντέλα, τα οποία εκπαιδεύτηκαν στα ομηρικά έπη (Ιλιάδα και Οδύσσεια) και βαθμολογήθηκαν τόσο στα ίδια τα έπη όσο και στους καλούμενους Ομηρικούς ύμνους. Η βαθμολόγηση πραγματοποιήθηκε αφενός μεν μετρώντας με αυτόματο τρόπο τη γλωσσική συγγένεια ενός δείγματος κειμένου με το σύνολο του εκάστοτε γλωσσικού μοντέλου, αφετέρου δε ταξινομώντας αποσπάσματα ομηρικών κειμένων. Με αυτόν τον τρόπο, εντοπίστηκαν αποσπάσματα ομηρικών κειμένων να εμφανίζουν περισσότερη συγγένεια από άλλα αποσπάσματα σε γλωσσικό επίπεδο με το σύνολο των δεδομένων εκπαίδευσης. Πιο συγκεκριμένα, η ραψωδία Ο της Ιλιάδας με το σύνολο του έπους της Ιλιάδας και η ραψωδία β της Οδύσσειας με το συνολικό έπος της Οδύσσειας. Έπειτα, παρατηρήσαμε ότι η ραψωδία δ της Οδύσσειας εμφανίζει περισσότερη γλωσσική ομοιότητα με το έπος της Ιλιάδας και αντίστοιχα η ραψωδία Τ της Ιλιάδας με το έπος της Οδύσσειας. Ακολούθως, μελετήσαμε τη γλωσσική συγγένεια των Ομηρικών ύμνων Εἰς Ἀπόλλωνα, Εἰς Ἀφροδίτην, Εἰς Δημήτραν και Εἰς Ἑρμῆν με τα ομηρικά έπη και καταλήξαμε στο συμπέρασμα ότι ο ύμνος Εἰς Ἀφροδίτην εμφανίζει τη μεγαλύτερη γλωσσική συγγένεια με τα ομηρικά έπη. Τέλος, τα εν λόγω γλωσσικά μοντέλα αντιπαραβλήθηκαν με κρίσεις ανθρώπων-επισημειωτών, ώστε να ερευνηθεί η ικανότητά τους να κατηγοριοποιούν ορθά δοθέντα αποσπάσματα αρχαίων κειμένων στο αντίστοιχο έργο υπαγωγής τους. Συμπεράναμε ότι τα νευρωνικά γλωσσικά μοντέλα μακράς – βραχείας μνήμης δύνανται να ταξινομούν με μεγαλύτερη επιτυχία ομηρικά κείμενα στο αντίστοιχο έργο υπαγωγής τους απ’ ότι τα στατιστικά γλωσσικά μοντέλα και η ανθρώπινη κρίση.
Λέξη κλειδί Neural language models Long Short-Term Memory (LSTM)
Statistical Language Models (SLM)
Authorship attribution
Homeric hymns
Natural Language Processing (NLP)
Απόδοση συγγραφικής πατρότητας
Homeric epics
Νευρωνικά γλωσσικά μοντέλα μακράς-βραχείας μνήμης
Στατιστικά γλωσσικά μοντέλα
Ομηρικά έπη
Ομηρικοί ύμνοι
Επεξεργασία φυσικής γλώσσας
Διαθέσιμο από 2020-12-01 12:40:27
Ημερομηνία έκδοσης 20-11-2020
Ημερομηνία κατάθεσης 2020-12-01 12:40:27
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/