Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Toxicity detection in Greek parliamentary proceedings

dc.contributor.degreegrantinginstitutionAthens University of Economics and Business, Department of Informaticsen
dc.contributor.opponentKonstantinidou, Mariaen
dc.contributor.opponentAndroutsopoulos, Ionen
dc.contributor.thesisadvisorPavlopoulos, Ioannisen
dc.creatorΤασσόπουλος, Μάριοςel
dc.date.accessioned2025-03-26T20:02:50Z
dc.date.available2025-03-26T20:02:50Z
dc.date.issued2021
dc.date.submitted2022-01-05 20:16:39
dc.description.abstractThis thesis aims to examine toxicity used in parliamentary discourse. The goals of this task are 3: i) to create an exhaustive list of all toxicity/offensive language/ abusive language definitions for better recollection and future work on the subject ii) to examine if toxicity exists in Greek parliamentary discourse and what type we can find and iii) to examine whether the financial crisis of 2008 can affect the levels of toxicity. For the first goal, a literature review of papers was made and all definitions to our knowledge were collected. For the second and the third goal, several NLP methods were implored. Greek parliamentary proceedings were used as the dataset for our research as well as an annotated dataset which consisted of Greek tweets. The annotated dataset was used to fine-tune a Multinomial NB classifier to find toxicity in our discourse and then examine words that may be used in toxic context. From this process the words horrible, sycophant, criminal, and incompetent were selected. The word illegal immigrant was also examined for its possible toxic usage. Finally, words descriptive for ideology were compared for their similarity with fascism, considering that fascism is a taboo ideology and thus this could be another indicator for toxicity.en
dc.description.abstractΗ μεταπτυχιακή αυτή εργασία είναι μια απόπειρα να διερευνηθεί η τοξικότητα στον κοινοβουλευτικό λόγο. Οι στόχοι της εργασίας είναι τρεις: Πρώτον να δημιουργηθεί μια εξαντλητική λίστα με ορισμούς που αφορούν την τοξική/επιθετική/κακοποιητική γλώσσα, δεύτερον να εξεταστεί αν υφίσταται τοξικότητα στο ελληνικό κοινοβούλιο και τί είδους τοξικότητα μπορούμε να ανακαλύψουμε και τρίτον εαν η οικονομική κρίση του 2008 μπορεί να επηρεάσει τα επίπεδα της τοξικότητας. Για τον πρώτο στόχο πραγματοποιήθηκε μια βιβλιογραφική έρευνα και συλλέχθηκαν όλοι οι ορισμοί που αφορούν τους προαναφερθέντες όρους. Για τον δεύτερο και τον τρίτο στόχο αξιοποιήθηκαν μέθοδοι του τομέα της Επεξεργασίας Φυσικής Γλώσσας. Συγκεκριμένα αναλύθηκαν κοινοβουλευτικές ομιλίες από το 1989 μέχρι το 2019 και αξιοποιήθηκε παράλληλα ένα corpus δεδομένων συλλογής ελληνικών tweet, το οποίο είχε υποστεί επεξεργασία για να δηλωθούν ποια tweet έχουν επιθετική γλώσσα και ποια όχι. Μέσω αυτού και αξιοποιώντας έναν Multinomial Naïve Bayes ταξινομητή προκειμένουν να βρεθούν τοξικές ομιλίες. Στη συνέχεια από τις ομιλίες που χαρακτηρίστηκαν από τον ταξινομητή ως τοξικές, αναζητήθηκαν λέξεις για να μελετηθεί η γλωσσική τους χρήση. Οι λέξεις που βρέθηκαν ήταν τέσσερις: άθλιος, συκοφάντης, ανίκανος και εγκληματίας. Μελετήθηκε επίσης διεξοδικά η λέξη λαθρομετανάστης και η πιθανότητα να χρησιμοποιηθεί από τους ομιλητές τοξικά. Τέλος έγινε μια απόπειρα να εξεταστεί αν οι ομιλητές ταυτίζουν λέξεις που περιγράφουν ιδεολογίες με την λέξη «φασισμός» ως μια πιθανή τοξική ρητορική τεχνική.el
dc.embargo.expire2022-01-05 20:16:39
dc.embargo.ruleOpen access
dc.format.extent73p.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9014
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/10501
dc.languageen
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectWord embeddingsel
dc.subjectNatural language processingen
dc.subjectToxicity detectionen
dc.subjectparliamentary discourseen
dc.subjectWord embeddingsen
dc.subjectCritical discourse analysisen
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.subjectΑνίχνευση τοξικότηταςel
dc.subjectΚοινοβουλευτικός λόγοςel
dc.subjectΚριτική ανάλυση λόγουel
dc.titleToxicity detection in Greek parliamentary proceedingsen
dc.title.alternativeΑνίχνευση τοξικότητας στον ελληνικό κοινοβουλευτικό λόγοel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Tassopoulos_2021.pdf
Μέγεθος:
3.09 MB
Μορφότυπο:
Adobe Portable Document Format