ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη
Συλλογές :

Τίτλος :A data enrichment module based on Natural Language Processing techniques for context analysis of web news
Δημιουργός :Kolokathi, Fotini
Συντελεστής :Titsias, Michalis (Επιβλέπων καθηγητής)
Androutsopoulos, Ion (Εξεταστής)
Vassalos, Vasilios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Τύπος :Text
Σημείωση :Corporate supervisor: Kostas Tsagkaris
Φυσική περιγραφή :54 p.
Γλώσσα :en
Αναγνωριστικό :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=6406
Περίληψη :An implementation of a web service that takes as inputs the name of a location and a time interval and gives as outputs articles of Greek News websites that describe events, the kind (cultural, sport etc.) and the possible date of each event. For this purpose, five text representation models were created and eight machine learning classifiers were trained for each of them.Finally, the best model was chosen based on macro recall score.
Υλοποίηση ενός web service που λαμβάνει στην είσoδο το όνομα μιας τοποθεσίας και ένα χρονικό διάστημα και δίνει ως έξοδο άρθρα ελληνικών ειδησεογραφικών ιστοσελίδων που αναφέρονται σε εκδηλώσεις, το είδος (πολιτιστική, αθλητική κλπ.) και την πιθανή ημερομηνία κάθε εκδήλωσης. Για το σκοπό αυτό, πέντε μοντέλα αναπαράστασης κειμένου δημιουργήθηκαν και οκτώ αλγόριθμοι Μηχανικής Μάθησης για ταξινόμηση εκπαιδεύτηκαν για κάθε ένα από αυτά. Τέλος, επιλέχθηκε το καλύτερο μοντέλο με βάση τη macro recall μετρική.
Λέξη κλειδί :Natural language processing
Word embeddings
Text representation models
Imbalanced learning
Text classification
Διαθέσιμο από :2018-07-28 18:25:45
Ημερομηνία έκδοσης :2017
Ημερομηνία κατάθεσης :2018-07-28 18:25:45
Δικαιώματα χρήσης :Free access
Άδεια χρήσης :

Αρχείο: Kolokathi_2017.pdf

Τύπος: application/pdf