Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Deep learning-based OCR for Greek paleographic manuscripts

dc.contributor.degreegrantinginstitutionAthens University of Economics and Business, Department of Informaticsen
dc.contributor.opponentPapaioannou, Georgiosen
dc.contributor.opponentPavlopoulos, Ioannisen
dc.contributor.opponentAndroutsopoulos, Ionen
dc.contributor.thesisadvisorPapaioannou, Georgiosen
dc.contributor.thesisadvisorPavlopoulos, Ioannisen
dc.creatorPlatanou, Paraskevien
dc.creatorΠλατάνου, Παρασκευήel
dc.date.accessioned2025-03-26T20:02:57Z
dc.date.available2025-03-26T20:02:57Z
dc.date.issued12/21/2021
dc.date.submitted2022-01-12 20:31:23
dc.description.abstractToday classicists are provided with a great number of digital tools which, in turn, offer possibilities for further study and new research goals. In this thesis we explore the idea that old Greek handwriting can be machine-readable and consequently, researchers can study the target material fast and efficiently. Previous studies have shown that Optical Character Recognition (OCR) models are capable of attaining good accuracy rates. However, achieving high accuracy OCR results for Greek manuscripts is still considered to be a major challenge. The overall aim of this thesis is to examine the efficiency of OCR software for old manuscript reading and train a deep learning model for this task. To address this statement, we study and use digitized images of the Oxford University Bodleian Library Greek manuscripts. In particular, we follow steps which include image preprocessing, transcription and programming. Our ambition is to go beyond the many challenges we face from one step to the other, taking into consideration that Greek handwritten characters are challenging alone when it comes to machine reading, and develop OCR models using deep learning methods in order to render old Greek handwriting machine readable.en
dc.description.abstractΟι φιλόλογοι σήμερα έχουν στη διάθεσή τους μια σωρεία ψηφιακών εργαλείων τα οποία, με τη σειρά τους, προσφέρουν δυνατότητες για περαιτέρω μελέτη και νέους ερευνητικούς στόχους. Στην εργασία αυτή η έρευνά μας βασίζεται στην ιδέα ότι οι παλαιές ελληνικές γραφές μπορούν να γίνουν μηχαναγνώσιμες και εν συνεχεία οι ερευνητές μπορούν να μελετήσουν το υλικό το οποίο ενδιαφέρει άμεσα και αποτελεσματικά. Προηγούμενες μελέτες έχουν αποδείξει ότι τα μοντέλα Οπτικής Αναγνώρισης Χαρακτήρων έχουν τη δυνατότητα να αγγίζουν ικανοποιητικούς δείκτες ακρίβειας. Εντούτοις, η αποτελεσματική Οπτική Αναγνώριση Χαρακτήρων ελληνικών χειρογράφων είναι μέχρι σήμερα μία μεγάλη πρόκληση. Ο στόχος της εργασίας αυτής είναι η εξέταση της αποτελεσματικότητας λογισμικού για την Οπτική Αναγνώριση Χαρακτήρων χειρογράφων κωδίκων και η προπόνηση μοντέλου βαθιάς μάθησης για το σκοπό αυτό. Για να απαντήσουμε στο ερώτημα αυτό, μελετούμε και κάνουμε χρήση των ψηφιοποιημένων εικόνων της συλλογής ελληνικών χειρογράφων της Βοδληιανής Βιβλιοθήκης του Πανεπιστημίου της Οξφόρδης. Συγκεκριμένα, ακολουθούμε μία διαδικασία η οποία περιλαμβάνει επεξεργασία εικόνας, μεταγραφή και προγραμματισμό. Φιλοδοξούμε να αντιμετωπίσουμε τις διάφορες προκλήσεις που συναντούμε κατά τη διαδικασία αυτή, λαμβάνοντας υπόψιν ότι μόνοι οι ελληνικοί γραφικοί χαρακτήρες προσθέτουν εξαιρετική δυσκολία στη μηχαναγνωσιμότητα, και να παρουσιάσουμε μοντέλο Οπτικής Αναγνώρισης Χαρακτήρων με τη χρήση μεθόδων βαθιάς μάθησης με σκοπό να καταστήσουμε τους ελληνικούς χειρόγραφους κώδικες μηχαναγνώσιμους.el
dc.embargo.expire2022-01-12 20:31:23
dc.embargo.ruleOpen access
dc.format.extent64σ.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9055
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/10542
dc.languageen
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectDeep learningen
dc.subjectOCRen
dc.subjectDigital paleographyen
dc.subjectHandwritingen
dc.subjectGreek languageen
dc.subjectΒαθιά μάθησηel
dc.subjectΟπτική αναγνώριση χαρακτήρωνel
dc.subjectΨηφιακή παλαιογραφίαel
dc.subjectΧειρόγραφος χαρακτήραςel
dc.subjectΕλληνική γλώσσαel
dc.titleDeep learning-based OCR for Greek paleographic manuscriptsen
dc.title.alternativeΟπτική αναγνώριση χαρακτήρων με βαθιά μάθηση για ελληνικούς χειρόγραφους κώδικεςel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Platanou_2021.pdf
Μέγεθος:
3.02 MB
Μορφότυπο:
Adobe Portable Document Format