Λογότυπο αποθετηρίου
 

The application of machine learning algorithms in the study of out-of-wedlock fertility patterns in Thrace, Greece

Μικρογραφία εικόνας

Ημερομηνία

2025-09-29

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Επιβλέπων / ουσα

Διαθέσιμο από

Περίληψη

This MSc thesis (Applied Statistics, Athens University of Economics and Business) examines out-of-wedlock fertility in Thrace, Greece (2000–2018) using population-level anonymized birth microdata from the Hellenic Statistical Authority (ELSTAT) (N = 67,706 births). The study combines exploratory demographic analysis with predictive modelling to investigate the socio-demographic, cultural, and geographic determinants of extramarital births in a culturally diverse and socioeconomically disadvantaged region. Descriptive findings reveal substantial spatial variation across municipalities and a strong concentration of nonmarital births among adolescents, low-educated mothers, and Roma populations, alongside an emerging pattern among older, highly educated women, indicating heterogeneous pathways into nonmarital family formation. Methodologically, the thesis integrates logistic regression with ensemble machine learning approaches (XGBoost, Random Forests, LightGBM, and CatBoost) to capture nonlinear relationships and complex interactions. Model performance is assessed under pronounced class imbalance using precision, recall, F1-score, balanced accuracy, ROC-AUC, and AUPRC, with classification thresholds optimized for substantive relevance. Model interpretability is addressed through feature importance measures and SHAP values, allowing for transparent comparison between traditional statistical models and machine learning techniques. Overall, the results support a dual interpretation of extramarital fertility in Thrace: as both a manifestation of social disadvantage and inequality and a reflection of changing family behaviors consistent with Second Demographic Transition perspectives. The thesis highlights the need for targeted social policies supporting vulnerable mothers and ensuring equal legal and social protection for children regardless of parental marital status.
Η παρούσα μεταπτυχιακή διπλωματική εργασία εξετάζει τη γονιμότητα εκτός γάμου στη Θράκη κατά την περίοδο 2000–2018, αξιοποιώντας ανωνυμοποιημένα μικροδεδομένα γεννήσεων της Ελληνικής Στατιστικής Αρχής (ΕΛΣΤΑΤ) (N = 67.706 γεννήσεις). Η ανάλυση συνδυάζει τη διερευνητική ανάλυση με προγνωστική μοντελοποίηση, με στόχο τη διερεύνηση της επίδρασης των κοινωνικοδημογραφικών, πολιτισμικών και γεωγραφικών παραγόντων στην εκτός γάμου δημιουργία οικογένειας σε μια πολιτισμικά ετερογενή και κοινωνικοοικονομικά ευάλωτη περιοχή. Τα περιγραφικά αποτελέσματα αναδεικνύουν έντονες χωρικές διαφοροποιήσεις μεταξύ Δήμων και απόκτηση παιδιών εκτός γάμου κυρίως από έφηβες γυναίκες, με χαμηλό μορφωτικό επίπεδο, αλλά και γυναικών Ρομά, καθώς και ένα αναδυόμενο πρότυπο μεγαλύτερων ηλικιακά γυναικών με υψηλό επίπεδο εκπαίδευσης, υποδηλώνοντας ετερογενείς διαδρομές προς τη μη συζυγική τεκνογονία. Σε μεθοδολογικό επίπεδο, η εργασία χρησιμοποιεί εκτός από τη λογιστική παλινδρόμηση και μεθόδους μηχανικής μάθησης (XGBoost, Random Forests, LightGBM και CatBoost), ώστε να αποτυπωθούν μη γραμμικές σχέσεις και σύνθετες αλληλεπιδράσεις. Η αξιολόγηση των μοντέλων λαμβάνει υπόψη την έντονη ανισορροπία των κλάσεων (οι εκτός γάμου γεννήσεις αποτελούν μόλις το 4.7% του συνόλου των γεννήσεων), χρησιμοποιώντας δείκτες όπως precision, recall, F1-score, balanced accuracy, ROC-AUC και AUPRC, καθώς και βελτιστοποίηση κατωφλίων ταξινόμησης (threshold tuning). Η ερμηνευσιμότητα διασφαλίζεται μέσω δεικτών σπουδαιότητας μεταβλητών και τιμών SHAP (Feature Importance Plots and SHAP values). Συνολικά, τα ευρήματα υποστηρίζουν μια διττή ερμηνεία της εκτός γάμου γονιμότητας στη Θράκη: αφενός ως έκφραση κοινωνικής ανισότητας και φτώχειας, και αφετέρου ως ένδειξη μεταβαλλόμενων οικογενειακών προτύπων, σε συνάφεια με τη θεωρία της Δεύτερης Δημογραφικής Μετάβασης. Η εργασία αναδεικνύει την ανάγκη για στοχευμένες κοινωνικές πολιτικές στήριξης ευάλωτων μητέρων και για την ισότιμη νομική και κοινωνική προστασία όλων των παιδιών, ανεξαρτήτως οικογενειακής κατάστασης των γονέων.

Περιγραφή

Λέξεις-κλειδιά

Extramarital fertility, Thrace, Greece, Machine learning, Socio-demographic determinants, Εκτός γάμου τεκνοποίηση, Θράκη, Ελλάδα, Μηχανική μάθηση, Κοινωνικο-δημογραφικοί παράγοντες

Παραπομπή