Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Hedge detection: an application on the wikipedia corpus

dc.contributor.degreegrantinginstitutionAthens University of Economics and Business, Department of Management Science and Technologyen
dc.contributor.opponentChatziantoniou, Damianosen
dc.contributor.opponentSpinellis, Diomidisen
dc.contributor.thesisadvisorLouridas, Panagiotisen
dc.creatorAgapiou, Mariosen
dc.creatorΑγαπίου, Μάριοςel
dc.date.accessioned2025-03-26T20:02:41Z
dc.date.available2025-03-26T20:02:41Z
dc.date.issued2020
dc.date.submitted2021-11-26 17:28:49
dc.description.abstractThe purpose of this thesis is to develop a system that automatically detects hedges in Wikipedia articles, using weasel tags. The motivation behind this research project was to tackle the issue of ambiguity in Wikipedia articles, which could lead to the promo-tion of misleading information to the reader. This paper provides the general over-view of this task, including the extraction of the data, the classification methods that were used, as well as the evaluation metrics employed to examine the overall perfor-mance of these methods. In this thesis we experimented with machine and deep learn-ing models to apply the text classification. We implemented Support Vector Machine and XGBoost classifiers, and developed neural networks, such as Convolutional Neu-ral Networks (CNNs) and Recurrent Neural Networks (RNNs) with Long short-term memory (LSTM) architecture to complete this task. We then evaluated these systems against the best performing systems from previous studies that focus on this issue. Overall, we achieved notable results on our dataset, surpassing most hedge detection systems from previous studies, and thus proving the effectiveness of our methods.en
dc.description.abstractΣκοπός αυτής της διατριβής είναι να αναπτυχθεί ένα σύστημα που ανιχνεύει αυτόματα αμφισημίες σε άρθρα της Βικιπαίδειας, χρησιμοποιώντας ετικέτες weasel. Το κίνητρο πίσω από αυτό το ερευνητικό έργο ήταν να αντιμετωπιστεί το θέμα της ασάφειας στα άρθρα της Βικιπαίδειας, που θα μπορούσε να οδηγήσει στην προώθηση παραπλανητικών πληροφοριών στον αναγνώστη. Το παρόν έγγραφο παρέχει τη γενική επισκόπηση αυτού του έργου, συμπεριλαμβανομένης της εξαγωγής των δεδομένων, των μεθόδων κατηγοριοποίησης που χρησιμοποιήθηκαν, καθώς και των μετρήσεων αξιολόγησης που εφαρμόστηκαν για την εξέταση της συνολικής απόδοσης αυτών των μεθόδων. Σε αυτή τη διατριβή πειραματιστήκαμε με μοντέλα τόσο μηχανικής όσο και βαθιάς Μάθησης για να εφαρμόσουμε την ταξινόμηση κειμένου. Υλοποιήσαμε Support Vector Machine και XGBoost ταξινομητές, και αναπτύξαμε νευρωνικά δίκτυα, όπως τα Convolutional Neural Networks (CNNs) και τα Reccurent Neural Networks (RNNs) με αρχιτεκτονική Long short-term memory (LSTM) για την ολοκλήρωση αυτής της εργασίας. Στη συνέχεια, αξιολογούμε αυτά τα συστήματά συγκριτικά με τα καλύτερα συστήματα από προηγούμενες μελέτες που εστιάζουν σε αυτό το ζήτημα. Συνολικά, πετύχαμε αξιοσημείωτα αποτελέσματα, ξεπερνώντας τα περισσότερα συστήματα ανίχνευσης αμφισημιών από προηγούμενες μελέτες, αποδεικνύοντας έτσι την αποτελεσματικότητα των μεθόδων μας.el
dc.embargo.expire2021-11-26 17:28:49
dc.embargo.ruleOpen access
dc.format.extent58p.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8952
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/10439
dc.languageen
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectDeep learningen
dc.subjectHedge detectionen
dc.subjectNatural language processingen
dc.subjectΒαθιά μάθησηel
dc.subjectΑνίχνευση αμφισημιώνen
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.titleHedge detection: an application on the wikipedia corpusen
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Agapiou_2021.pdf
Μέγεθος:
1.9 MB
Μορφότυπο:
Adobe Portable Document Format