Abstract : | Η χρονολόγηση ιστορικών χειρογράφων μπορεί να γίνει με φυσικές, παλαιογραφικές και μηχανικές μεθόδους. Οι μηχανικές μέθοδοι έχουν αναπτυχθεί τα τελευταία χρόνια, αξιοποιούν την τεχνητή νοημοσύνη, έχουν πολλά πλεονεκτήματα και έρχονται να συμπληρώσουν τις παλαιογραφικές μεθόδους. Σε αυτήν την εργασία δημιουργήσαμε δύο παράλληλα corpora, το ένα αποτελείται από κομμάτια έγχρωμων εικόνων 63 παπύρων και το άλλο από κομμάτια αυτών των εικόνων μετά από χειροκίνητη δυαδικοποίηση σε εφαρμογή επεξεργασίας εικόνας. Στη συνέχεια με αυτά τα δεδομένα εκπαιδεύσαμε ταξινομητές μηχανικής μάθησης και διαπιστώσαμε ότι τα μοντέλα που εκπαιδεύτηκαν με το corpus των έγχρωμων εικόνων αποδίδουν καλύτερα σε σχέση με αυτά που εκπαιδεύτηκαν με τις δυαδικές εικόνες (80% ακρίβεια για τις έγχρωμες εικόνες και 48% για τις δυαδικές). Τέλος, κάναμε ανάλυση εξηγησιμότητας με το lime, ένα μοντέλο που παρέχει κατανοητές από τον άνθρωπο εξηγήσεις για τις προβλέψεις ενός αλγορίθμου μηχανικής μάθησης. Dating historical manuscripts can be achieved through physical, palaeographic and computational methods. Computational methods utilizing artificial intelligence have been developed in recent years offering many advantages and complementing palaeographic methods. In this thesis we created two parallel corpora, one comprising colour pieces of images of 63 papyri and the other comprising the corresponding binary pieces manually generated using an image processing application. We then trained machine learning classifiers using this data and showed that models trained on the corpus of colour images outperformed those trained on binary images, achieving an accuracy of 80% for colour images compared to 48% for binary images. Finally, we performed explainability analysis employing LIME, a model that provides human-understandable explanations for the predictions made by machine learning algorithms.
|
---|