Data-driven political narrative classification: quantitative analysis of the Tempi train crash narratives
Ημερομηνία
2026-03-26
Συγγραφείς
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
This thesis investigates the political narratives within the Greek Parliament surrounding the Train Crash near Tempi in Greece on February 28, 2023. Recognizing the labor-intensive nature of traditional methods of discourse analysis, this research proposes a purely data-driven methodology for the extraction of political narratives, the creation of a narrative taxonomy and the automated classification of the parliamentary speeches using computational tools. The analysis of the dataset, which spans from March 2023 until August 2025, was completed with Natural Language Processing techniques, including contextual embeddings, clustering and Large Language Models and resulted in the creation of a 16-class narrative taxonomy which was utilized to classify the corpus through a multi-model approach. The quantitative analysis demonstrates the existence of two different poles within the Parliament in regard to the Tempi train crash. The governing party stands alone and employs narratives that emphasize post-crash management and accuse the opposition of politicking. In contrast, the vast majority of the opposition consolidates around narratives framing the government as culpable for the crash and of orchestrating a cover-up. Ultimately, this research demonstrates that computational methods can significantly accelerate and automate the analysis of large datasets of political discourse, offering an alternative to traditional discourse analysis.Η παρούσα διπλωματική εργασία ερευνά τα πολιτικά αφηγήματα εντός του Ελληνικού Κοινοβουλίου σχετικά με το σιδηροδρομικό δυστύχημα στα Τέμπη στις 28 Φεβρουαρίου 2023. Αναγνωρίζοντας την εξαντλητική φύση των παραδοσιακών μεθόδων ανάλυσης λόγου, η παρούσα έρευνα προτείνει μια αμιγώς βασισμένη σε δεδομένα μεθοδολογία για την εξαγωγή πολιτικών αφηγημάτων, τη δημιουργία μιας ταξινομίας αφηγημάτων και την αυτοματοποιημένη ταξινόμηση των ομιλιών του Κοινοβουλίου με τη χρήση υπολογιστικών μεθόδων. Η ανάλυση του συνόλου των δεδομένων, το οποίο εκτείνεται από τον Μάρτιο του 2023 ως τον Αύγουστο του 2025, ολοκληρώθηκε τεχνικές Επεξεργασίας Φυσικής Γλώσσας, συμπεριλαμβανομένων των διανυσμάτων βάσει συμφραζόμενων (contextual embeddings), της συσταδοποίησης (clustering) και των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models). Η διαδικασία οδήγησε στην δημιουργία μίας ταξινομίας 16 κατηγοριών, η οποία χρησιμοποιήθηκε για την ταξινόμηση του σώματος κειμένων μέσω μίας προσέγγισης πολλαπλών μοντέλων (ensemble). Η ποσοτική ανάλυση καταδεικνύει την ύπαρξη δύο διαφορετικών πόλων εντός του Κοινοβουλίου όσον αφορά το δυστύχημα στα Τέμπη. Το κυβερνών κόμμα ακολουθεί αυτόνομη ρητορική και χρησιμοποιεί αφηγήματα τα οποία δίνουν έμφαση στην διαχείριση μετά το δυστύχημα και κατηγορούν την αντιπολίτευση για μικροπολιτική εκμετάλλευση. Από την άλλη πλευρά, η συντριπτική πλειοψηφία των κομμάτων της αντιπολίτευσης συσπειρώνεται γύρω από αφηγήματα που κατηγορούν την κυβέρνηση ως υπαίτια του δυστυχήματος και για συγκάλυψη. Εν κατακλείδι, η παρούσα έρευνα παρουσιάζει μία προσέγγιση που βασίζεται σε υπολογιστικές μεθόδους, η οποία επιταχύνει και εν μέρει, αυτοματοποιεί την ανάλυση μεγάλου όγκου δεδομένων πολιτικού λόγου, προσφέροντας μία εναλλακτική λύση στην παραδοσιακή ανάλυση λόγου.
Περιγραφή
Λέξεις-κλειδιά
Natural Language Processing (NLP), Political narratives, Greek Parliament proceedings, Tempi train crash, Επεξεργασία φυσικής γλώσσας, Πολιτικά αφηγήματα, Πρακτικά Ελληνικού Κοινοβουλίου, Δυστύχημα των Τεμπών

