Περίληψη : | Στην παρούσα εργασία αναπτύχθηκε ένα σύστημα ορθογραφικής διόρθωσης και κανονικοποίησης κριτικών προϊόντων γραμμένων στην Αγγλική γλώσσα. Για την εύρεση και τη διόρθωση των λαθών χρησιμοποιείται ένα γλωσσικό μοντέλο n-γραμμάτων, λεξικά, η DBpedia και ένα εργαλείο αναγνώρισης ονομάτων οντοτήτων. Για την ανάπτυξη και την αξιολόγηση του συστήματος χρησιμοποιήθηκαν κείμενα από ένα διεθνή διαγωνισμό εξόρυξης γνώμης, στα οποία επισημειώθηκαν χειρωνακτικά οι επιθυμητές διορθώσεις και κανονικοποιήσεις. Οι επιδόσεις του συστήματος ήταν αρκετά ικανοποιητικές όταν τα δεδομένα ανάπτυξης και αξιολόγησης περιείχαν κριτικές προϊόντων του ίδιου είδους και το γλωσσικό μοντέλο είχε εκπαιδευτεί σε σώμα κειμένων συναφών θεμάτων. Αντιθέτως, τα αποτελέσματα ήταν αρκετά χειρότερα όταν τα δεδομένα ανάπτυξης και αξιολόγησης περιείχαν κριτικές προϊόντων διαφορετικών ειδών ή όταν το γλωσσικό μοντέλο είχε εκπαιδευτεί σε μη συναφές σώμα κειμένων.
|
---|