PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Computational analysis of Greek Parliamentary Minutes of the period 1946-1947
Alternative Title :Υπολογιστική ανάλυση των Πρακτικών του Ελληνικού Κοινοβουλίου της περιόδου 1946-1947
Creator :Μπαρμπούνης, Επαμεινώνδας-Κωνσταντίνος
Barmpounis, Epameinondas-Konstantinos
Contributor :Pavlopoulos, Ioannis (Επιβλέπων καθηγητής)
Androutsopoulos, Ion (Εξεταστής)
Louridas, Panagiotis (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Extent :43p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10013
Abstract :Σκοπός της παρούσας μεταπτυχιακής εργασίας είναι να μελετηθεί η αποδοχή του κοινού της Βουλής των Ελλήνων στα λεχθέντα των από του βουλευτικού βήματος ρητόρων κατά τη διάρκεια των ετών 1946 και 1947. Οι στόχοι είναι πολλαπλοί. Αρχικά επιδιώκεται η δημιουργία ενός μηχαναγνώσιμου corpus κειμένων που θα αποτελείται από τα ίδια τα πρακτικά. Δεύτερον η καταγραφή των ονομάτων των ρητόρων που με τα λόγια τους και με τα θέματα που προσέγγισαν προκάλεσαν την αποδοχή της Βουλής. Τελικά η καταγραφή των ίδιων των θεμάτων που φαίνεται να αποδέχεται (συνήθως με ενθουσιασμό), το κοινό. Σε μια τόσο τεταμένη και ασταθή περίοδο όσο αυτή των πρώτων μεταπολεμικών χρόνων, η ένταξη των θεμάτων αυτών στον ιστορικό χρόνο που προσεγγίζεται, βοηθά στην ευρύτερη κατανόηση της κοινωνίας της περιόδου. Ύστερα τα ονόματα των βουλευτών βοηθούν στην κατανόηση των θέσεων των διάφορων κομμάτων της περιόδου. Για τον πρώτο στόχο χρησιμοποιήθηκαν πρακτικά της Βουλής που υπάρχουν στο διαδίκτυο σε μορφή PDF, και τα οποία μεταφορτώθηκαν μαζικά από την ιστοσελίδα της Βιβλιοθήκης της Βουλής με χρήση κώδικα (scraper). Σε αυτά εφαρμόστηκε OCR για την εξαγωγή του κειμένου. Για τον δεύτερο και τον τρίτο στόχο αξιοποιήθηκαν τεχνικές Επεξεργασίας Φυσικής Γλώσσας.
The purpose of this postgraduate work is to study the correspondence of the MPs of the Hellenic Parliament in the words of the Rhetoricians in the Greek Parliament during the years 1946 and 1947. The contributions of this work are threefold. The first objective regards the creation of a machine-readable corpus of texts, made up of the Minutes themselves. The second objective refers to the recording of the orators' names who, with their words and the issues they approached, caused the acceptance of the House. The third and final objective is the recording of the very issues that seem to be accepted (usually with enthusiasm), by the MPs. In a period as tense and unstable as that of the first post-war years, the integration of these issues into the historical time approached, helps in the broader understanding of the society of the period. Then, the names of the MPs can potentially help us understand the views of the various parties of the period. For the first goal, Parliament’s Minutes were used in PDF format, which were massively scraped from the Internet using a simple program. OCR was used to obtain the text. Natural Language Processing (NLP) techniques were used for the second and third goals.
Subject :Επεξεργασία φυσικής γλώσσας
Πρακτικά Ελληνικού Κοινοβουλίου
Οπτική αναγνώριση χαρακτήρων
Αναγνώριση χειρόγραφου κειμένου
Γλωσσική τεχνολογία
Natural Language Processing (NLP)
Hellenic Parliament Minutes
Optical Character Recognition (OCR)
Handwritten Text Recognition (HTR)
Language technology
Date Available :2023-02-05 21:10:35
Date Issued :13-12-2022
Date Submitted :2023-02-05 21:10:35
Access Rights :Free access
Licence :

File: Barmpounis_2022.pdf

Type: application/pdf