Περίληψη : | Η διατήρηση της πολιτιστικής κληρονομιάς στην εποχή μας έχει συνδεθεί άρρηκτα με την ψηφιοποίηση των διάφορων τεκμηρίων που απόκεινται σε βιβλιοθήκες, μουσεία και λοιπούς πολιτιστικούς φορείς. Όταν τα τεκμήρια αυτά είναι χειρόγραφα, η ψηφιοποίηση έγκειται σε φωτογράφιση όλων των σελίδων και αποθήκευσή τους σε ψηφιακά αποθετήρια. Μια τέτοια ψηφιοποίηση μπορεί να σώζει το περιεχόμενο ενός χειρογράφου σε μορφή εικόνας, όμως το ίδιο το κείμενο που περιέχεται σε αυτό δεν είναι μηχαναγνώσιμο, δεν μπορεί δηλαδή κάποιος να το επεξεργαστεί ηλεκτρονικά ή να κάνει πιο συγκεκριμένες αναζητήσεις μέσα σε αυτό. Για τον λόγο αυτό, τα τελευταία χρόνια διερευνώνται όλο και περισσότερο τρόποι με τους οποίους θα γίνει δυνατή η όσο το δυνατόν πιο ακριβής αυτόματη αναγνώριση κειμένου μέσα από χειρόγραφα. Η διαδικασία αυτή ονομάζεται στα αγγλικά «Handwritten Text Recognition», ή πιο σύντομα, «HTR». Στην Ελλάδα έχουμε την τύχη να διαθέτουμε άφθονα χειρόγραφα, ποικίλου περιεχομένου. Μια διακριτή κατηγορία χειρογράφων είναι αυτά που περιέχουν ύμνους βυζαντινής μουσικής (ο αριθμός τους υπολογίζεται σε 7.000 περίπου). Η ιδιαιτερότητά τους έγκειται στο ξεχωριστό σύστημα γραφής της μουσικής αυτής, το οποίο είναι αυτόνομο και δεν σχετίζεται με άλλες μορφές μουσικής σημειογραφίας. Στην παρούσα εργασία επιχειρείται η δημιουργία ενός μοντέλου αυτόματης αναγνώρισης κειμένου, το οποίο όμως θα αφορά μόνο σε βυζαντινά μουσικά χειρόγραφα, κάτι που επιχειρείται πρώτη φορά. Σκοπός είναι να καταδειχθεί σε πιλοτικό επίπεδο αν και κατά πόσο είναι δυνατόν να εκπαιδευτεί ένα τέτοιο μοντέλο και σε τι ποσοστό ακριβείας μπορεί να φτάσει. Για αυτό και δεν επιλέχθηκε ποικιλία χειρογράφων με διαφορετικά στυλ γραφής από πολλές χρονικές περιόδους, αν και το χρονικό εύρος που καλύπτουν τα βυζαντινά μουσικά χειρόγραφα αγγίζει τη μία χιλιετία. Η εκπαίδευση του μοντέλου έγινε με ένα μόνο στυλ γραφής, αυτό του Χουρμουζίου Χαρτοφύλακος, από τον κώδικα ΕΒΕ- ΜΠΤ 761 (περ. 1830-1835). Τέλος, έγινε μια ταξινόμηση των σφαλμάτων του μοντέλου, με σκοπό την βελτίωσή του στο μέλλον. The preservation of cultural heritage nowadays has been inextricably linked with the digitization of the various artifacts found in libraries, museums and other cultural institutions. When these artifacts are manuscripts, the digitization process involves scanning all the pages and storing them into digital repositories. Such a digitization may preserve a manuscript's content in image form, but the text itself is not machine-readable, meaning that one cannot edit or perform more specific searches within it. For this reason, recent research has focused increasingly on enabling automatic text recognition from manuscripts. This process is called "Handwritten Text Recognition", or, more briefly, "HTR". In Greece, we are fortunate to have an abundance of manuscripts of various contents. A distinct category of manuscripts is those containing hymns of Byzantine Μusic (their number is estimated at approximately 7,000). Their particularity lies in the unique set of symbols used to represent this music, creating a distinct musical notation. This thesis attempts to develop a text recognition model tailored specifically to Byzantine Music manuscripts. It is the first time such an attempt has been made. The purpose is to show if and to what extent it is possible to train such a model and what the percentage of accuracy it can reach. For this reason, we did not select a variety of manuscripts with different writing styles from several time periods, although the period covered by Byzantine Music manuscripts reaches one millennium. The model was trained in a single writing style, that of Chourmouzios Chartofylax, from EBE-ΜΠΤ 761 manuscript (ca.1830-1835). Finally, an error analysis was conducted, with the aim of improving the model’s performance in the future.
|
---|