Detecting gendered language patterns in Greek political discourse using NLP
Ημερομηνία
2026-02-13
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
Gendered discourse refers to the way language reflects, reinforces and sometimes even challenges the already created stereotypes associated with masculinity and femininity. In other words, it is not just about how people use language differently, but about how language constructs the roles of “femininity” and “masculinity” and urges people to perform an identity. Discourse used in conversations, writings and even institutional speeches can depict how society “sees” gender and in particular gender roles. Even in official institutions, like the Greek Parliament, language used by politicians reflects how gender is perceived, and how one should use language to present a more assertive or friendly image. At the same time, this idea of “performative” discourse influences minority groups, such as the LGBTQ+ community, that can become the target of “Pinkwashing” strategies, namely a form of performative activism where companies or political parties promote themselves as “pro-LGBTQ+” to legitimize negative behaviours. This study is primarily concerned with identifying gendered speech in the proceedings of the Greek Parliament and how it can be detected both by humans and machines. In particular, the study examines whether certain linguistic traits, such as the word choice, hedging devices and the use of evaluative adjectives, can highlight if the speech contains or not gendered language. To achieve that, a group of two expert annotators was formed that was asked to label a dataset of 200 examples of speeches of the proceedings of the Greek parliament based on the existence or not of gendered discourse. Simultaneously, a Large Language Model, Llama3-70b-Instruct, was requested to annotate the same speeches to evaluate its performance compared to human annotations. In addition, lexicons that reflected word choices of males and females, in the context of political discourse were created, by prompting Llama3-70b-Instruct based on sociolinguistic theory, to capture the lexicons’ term frequency in the corpus and the semantic relations between female and male-associated terms. To achieve the creation of a common semantic space Greek-Bert was selected. Another type of lexicon containing phrases that could possibly indicate “Pinkwashing” strategies was also created and the prominence of these phrases per political party was computed, using TF-IDF, aiming at revealing how “Pinkwashing” is reflected through language and what political parties tend to take advantage of this strategy more often. The results showed that humans could detect gendered speech patterns, whereas the language model had a hard time recognizing gendered discourse, meanwhile the semantic representation of the lexicon emphasizes the performance of gender roles. As far as “Pinkwashing” is concerned, contextualization of the suggested lexicon pointed out that the terms were used in the broader theme of supporting human rights.Ο έμφυλος λόγος συχνά αναφέρεται στο πώς η γλώσσα αντανακλά, ενισχύει ή και αμφισβητεί ήδη παγιωμένα στερεότυπα που σχετίζονται με την «αρρενωπότητα» και «θηλυκότητα». Με άλλα λόγια, δεν αφορά αποκλειστικά τον τρόπο με τον οποίο οι άνθρωποι χρησιμοποιούν τη γλώσσα διαφορετικά, αλλά πολύ περισσότερο το πώς η γλώσσα κατασκευάζει τους ρόλους της «αρρενωπότητας» και της «θηλυκότητας» και παρακινεί τους ανθρώπους να επιτελούν μία κοινωνικά κατασκευασμένη ταυτότητα. Ο λόγος που χρησιμοποιείται σε συζητήσεις, κείμενα, αλλά ακόμα και σε θεσμικές ομιλίες μπορεί να απεικονίσει το πώς η κοινωνία αντιλαμβάνεται τους έμφυλους ρόλους. Ακόμα και σε επίσημους θεσμούς, όπως το Ελληνικό κοινοβούλιο, η γλώσσα που χρησιμοποιείται από πολιτικούς αντικατοπτρίζει τον τρόπο με τον οποίο το φύλο γίνεται αντιληπτό, καθώς και το πώς κάποιος μπορεί να χρησιμοποιήσει τη γλώσσα για να παρουσιάσει μία πιο δυναμική ή φιλική εικόνα. Παράλληλα, η ιδέα του «επιτελεστικού» λόγου επηρεάζει ομάδες που ανήκουν σε μειονότητες, όπως η ΛΟΑΤΚΙ+ κοινότητα, η οποία γίνεται στόχος στρατηγικών «Pinkwashing» από μεγάλες εταιρείες ή πολιτικά κόμματα, τα οποία προβάλλονται ως «υπέρ των ΛΟΑΤΚΙ+» δικαιωμάτων. Η παρούσα μελέτη επικεντρώνεται στον εντοπισμό του έμφυλου λόγου στα πρακτικά του Ελληνικού Κοινοβουλίου και στον τρόπο με τον οποίο μπορεί να ανιχνευθεί τόσο από ανθρώπους, όσο και από μηχανές. Συγκεκριμένα, η μελέτη αυτή εξετάζει εάν ορισμένα γλωσσικά χαρακτηριστικά, όπως η η επιλογή λέξεων, μόρια που δείχνουν μετριασμό στον λόγο, καθώς και η χρήση επιθέτων μπορούν να αναδείξουν την ύπαρξη ή μη έμφυλου λόγου. Για να επιτευχθεί αυτό, συγκροτήθηκε μία ομάδα δύο επισημειωτών, στους οποίους ζητήθηκε να επισημάνουν ένα σύνολο δεδομένων 200 αποσπασμάτων από ομιλίες του ελληνικού κοινοβουλίου, ενώ ταυτόχρονα ένα μεγάλο γλωσσικό μοντέλο, το Llama3-70b-Instruct, σχολίασε τις ίδιες ομιλίες προκειμένου να αξιολογηθεί η απόδοσή του συγκριτικά με τους ανθρώπους. Επιπλέον, δημιουργήθηκαν λεξικά, που αντικατοπτρίζουν τις γλωσσικές επιλογές των ανδρών και των γυναικών με τη βοήθεια του Llama3-70b-Instruct, με βάση θεωρίες κοινωνιογλωσσολογίας, με σκοπό την καταγραφή της συχνότητας των όρων στο σώμα κειμένων. Παράλληλα, σημασιολογικές σχέσεις μεταξύ των όρων των λεξικών δημιουργήθηκαν με τη συμβολή του Greek-Bert. Τέλος, δημιουργήθηκε ένα ακόμα λεξικό, το οποίο αφορά φράσεις οι οποίες θα μπορούσαν να υποδηλώνουν «Pinkwashing», έτσι ώστε να υπολογιστεί η βαρύτητα του κάθε όρου ανά πολιτικό κόμμα μέσα στο πέρας των χρόνων. Τα αποτελέσματα έδειξαν ότι οι άνθρωποι μπορούν να εντοπίσουν παραδείγματα έμφυλου λόγου, ενώ το γλωσσικό μοντέλο δυσκολεύεται να κατανοήσει έμφυλες χρήσεις λόγου, ταυτόχρονα η σημασιολογική αναπαράσταση υπογραμμίζει την επιτέλεση των έμφυλων ρόλων. Όσον αφορά το «Pinkwashing», κοιτώντας τον συγκείμενο στα Πρακτικά της Βουλής, αποδείχθηκε ότι οι προτεινόμενοι όροι χρησιμοποιούνται στο ευρύτερο πλαίσιο της υποστήριξης των ανθρώπινων δικαιωμάτων.
Περιγραφή
Λέξεις-κλειδιά
Gendered discourse, Pinkwashing, Large Language Models (LLMs), Έμφυλος λόγος, Μεγάλα γλωσσικά μοντέλα

