Abstract : | Η επεξεργασία φυσικής γλώσσας και ανάλυση συναισθήματος σε διαφορετικές πτυχές του επιστητού αποτελεί μια ενδιαφέρουσα πρόκληση για ανάλυση. Η παρούσα διπλωματική εργασία πραγματεύεται μια προσέγγιση για ανάλυση κειμένου της Ελληνικής γλώσσας βασισμένη σε λεκτική ανάλυση και εξαγωγή σημαντικών πληροφοριών της συναισθηματικής γλώσσας καθώς και της άποψης του συγγραφέα. Συγκεκριμένα η έρευνα προσανατολίζεται σε μια επιβλέπουσα μεθοδολογία μηχανικής μάθησης η οποία κατηγοριοποιεί τις γλωσσικές εκφράσεις ανάλογα με το αν αυτές προσδιορίζουν κάτι θετικό, αρνητικό ή ουδέτερο. Η στοιχειώδης γλωσσική γνώση σχετικά με τις διαφορετικές μορφές του συναισθήματος ενσωματώθηκε στην εκπαίδευση του αλγορίθμου. Σκοπός αυτής της διαδικασίας είναι η ανάπτυξη ενός μοντέλου το οποίο θα μπορεί να χρησιμοποιηθεί στην κατηγοριοποίηση μελλοντικών δεδομένων. Επιπλέον μέσω αυτής της διπλωματικής προτείνεται και αξιολογείται ένα Ελληνικό μοντέλο ανάλυσης κοινής γνώμης καθώς επίσης λύσεις και βελτιστοποιήσεις της. Natural language processing and sentiment analysis towards certain aspects is a challenging and intriguing field. The current paper comprises an analysis textual data in Greek language based on the linguistically analysis and extraction of meaningful information out of emotional language and writer's opinion for various matters. More specifically, the study is focused on a supervised machine learning methodology which classifies expressions into the proper polarity category. Common sense knowledge of related sentiment aspects is incorporated into the training of a machine learning algorithm for sentiment analysis. Finally, the objective of this process is the development of a model that can be later on use for the categorization of future data. In addition, the paper’s target is to propose and evaluate an opinion analysis model of the Greek language as well as to propose solutions for improvements.
|
---|