PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :A data enrichment module based on Natural Language Processing techniques for context analysis of web news
Creator :Kolokathi, Fotini
Contributor :Titsias, Michalis (Επιβλέπων καθηγητής)
Androutsopoulos, Ion (Εξεταστής)
Vassalos, Vasilios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Notes :Corporate supervisor: Kostas Tsagkaris
Extent :54 p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=6406
Abstract :An implementation of a web service that takes as inputs the name of a location and a time interval and gives as outputs articles of Greek News websites that describe events, the kind (cultural, sport etc.) and the possible date of each event. For this purpose, five text representation models were created and eight machine learning classifiers were trained for each of them.Finally, the best model was chosen based on macro recall score.
Υλοποίηση ενός web service που λαμβάνει στην είσoδο το όνομα μιας τοποθεσίας και ένα χρονικό διάστημα και δίνει ως έξοδο άρθρα ελληνικών ειδησεογραφικών ιστοσελίδων που αναφέρονται σε εκδηλώσεις, το είδος (πολιτιστική, αθλητική κλπ.) και την πιθανή ημερομηνία κάθε εκδήλωσης. Για το σκοπό αυτό, πέντε μοντέλα αναπαράστασης κειμένου δημιουργήθηκαν και οκτώ αλγόριθμοι Μηχανικής Μάθησης για ταξινόμηση εκπαιδεύτηκαν για κάθε ένα από αυτά. Τέλος, επιλέχθηκε το καλύτερο μοντέλο με βάση τη macro recall μετρική.
Subject :Natural language processing
Word embeddings
Text representation models
Imbalanced learning
Text classification
Date Available :2018-07-28 18:25:45
Date Issued :2017
Date Submitted :2018-07-28 18:25:45
Access Rights :Free access
Licence :

File: Kolokathi_2017.pdf

Type: application/pdf