Πλοήγηση ανά Επιβλέπων "Papastamoulis, Panagiotis"
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Τώρα δείχνει 1 - 7 από 7
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Analyzing incomplete voting data: the case of European Social Survey Round 10 in Greece(27-09-2024) Υφαντή-Κωστοπούλου, Μελίνη; Yfanti-Kostopoulou, Melini; Athens University of Economics and Business, Department of Statistics; Milienos, Fotios; Karlis, Dimitrios; Papastamoulis, PanagiotisΗ παρούσα εργασία έχει ως στόχο να σκιαγραφήσει το προφίλ όσων δεν απαντούν στην ερώτηση σχετικά με την ψήφο τους στις εθνικές εκλογές του 2019 στην Ελλάδα, χρησιμοποιώντας δεδομένα από τον 10ο γύρο της Ευρωπαϊκής Κοινωνικής Έρευνας. Μέσω διαφόρων μεθοδολογικών προσεγγίσεων, αναδείξαμε την πολύπλοκη φύση της μεροληψίας της μη-απόκρισης και εντοπίσαμε βασικά χαρακτηριστικά που διακρίνουν αυτούς που δεν απαντάνε από αυτούς που απαντάνε. Η ανάλυσή μας διερεύνησε την υπόθεση τυχαίας μη-απόκρισης και υπογράμμισε τη σημασία της κατανόησης των χαρακτηριστικών όσων δεν απαντάνε για την αποτελεσματική μείωση και αντιμετώπιση της μεροληψίας μη-απόκρισης. Δημιουργήσαμε ένα μοντέλο λογιστικής παλινδρόμησης που εντοπίζει παραμέτρους που επηρεάζουν τη μη απάντηση, όπως η πολιτική ενασχόληση και το πολιτικό ενδιαφέρον, οι κοινωνικοοικονομικοί παράγοντες και τα δημογραφικά χαρακτηριστικά των συμμετεχόντων στην έρευνα. Επιπλέον, η ανάλυση συστάδων δείχνει ότι οι μη αποκρινόμενοι χωρίζονται σε διακριτές υποομάδες με διαφορετικές πολιτικές στάσεις και απόψεις. Η ανάλυση συστάδων αποκάλυψε ότι οι μη αποκρινόμενοι αποτελούν μια ετερογενή ομάδα, η οποία αντανακλά την ευρύτερη ποικιλομορφία του πληθυσμού καθιστώντας δύσκολο τον μετριασμό του προβλήματος της μεροληψίας της μη απάντησης. Η παρούσα μελέτη συμβάλλει στη συνεχιζόμενη συζήτηση σχετικά με τη μη απόκριση στις εκλογικές και κοινωνικές έρευνες και προσφέρει γνώσεις για την καλύτερη κατανόηση και αντιμετώπιση αυτής της επίμονης πρόκληση.Τεκμήριο Approximate Bayesian computation methods for finite mixture models(09-11-2022) Γκιόκας, Ιωάννης; Gkiokas, Ioannis; Athens University of Economics and Business, Department of Statistics; Karlis, Dimitrios; Ntzoufras, Ioannis; Papastamoulis, PanagiotisΤα μοντέλα μείξεων κατανομών, χρησιμοποιούνται στη στατιστική εδώ και αιώνες, παρέχοντας ένα γενικό πλαίσιο μοντελοποίησης τόσο για την Μπεϋζιανή όσο και για τη κλασική στατιστική συμπερασματολογία. Επιπλέον, όσον αφορά την Μπεϋζιανή συμπερασματολογία, χρησιμοποιούνται συνήθως οι μέθοδοι Markov Chain Monte Carlo όταν πρόκειται για μοντέλα μείξεων κατανομών. Η παρούσα διατριβή ασχολείται με μια εναλλακτική Μπεϋζιανή προσέγγιση για τη μοντελοποίηση μοντέλων μείξεων κατανομών, τις Προσεγγιστικές Μπεϋζιανές Υπολογιστικές μεθόδους. Συγκεκριμένα, σκοπός των μεθόδων αυτών είναι η προσέγγιση της εκ των υστέρων πιθανότητας των άγνωστων παραμέτρων του μοντέλου μείξεων κατανομών χρησιμοποιώντας κάποιες στατιστικές ποσότητες. Τέλος, μία μελέτη προσομοίωσης λαμβάνει χώρα, στην οποία ορισμένοι αλγόριθμοι ABC εφαρμόζονται κάτω από διάφορα σενάρια, σε πεπερασμένα κανονικά μοντέλα μείξης.Τεκμήριο Bayesian factor analysis(27-09-2023) Φλήρης, Νικόλαος; Fliris, Nikolaos; Athens University of Economics and Business, Department of Statistics; Ntzoufras, Ioannis; Karlis, Dimitrios; Papastamoulis, PanagiotisH ανάλυση παραγόντων είναι μια πολυμεταβλητή στατιστική τεχνική που χρησιμοποιείται κυρίως για να χαρακτηρίσει τη δομή εξάρτησης των παρατηρούμενων συσχετιζόμενων μεταβλητών χρησιμοποιώντας μη παρατηρούμενες μεταβλητές γνωστές ως παράγοντες, ενώ ταυτόχρονα παρέχει μείωση των διαστάσεων. Σκοπός της παρούσας διατριβής είναι να περιγράψει το μοντέλο της παραγοντικής ανάλυσης καθώς και τις υποθέσεις και τα χαρακτηριστικά του. Επιπλέον, εξηγεί το ζήτημα της ταυτοποίησης των παραμέτρων ενός Μπεϋζιανού (Bayes) μοντέλου ανάλυσης παραγόντων, συγκεκριμένα, το πρόβλημα της μοναδικότητας του πίνακα διακυμάνσεων συνδιακυμανσεων των ιδιότυπων σφαλμάτων και το πρόβλημα ταυτοποίησης που αφορά τον πίνακα φορτώσεων παραγόντων. Επιπρόσθετα, περιγράφονται ορισμένες γνωστές Μπεϋζιανές μέθοδοι για προσομοίωση δειγμάτων από την εκ των υστέρων κατανομή που αφορούν τις παραμέτρους ενδιαφέροντος του μοντέλου ανάλυσης παραγόντων, καθώς και ορισμένες Μπεϋζιανές μέθοδοι που επιλύουν τα ζητήματα ταυτοποίησης των παραμέτρων ενός Μπεϋζιανού μοντέλου ανάλυσης παραγόντων. Επιπλέον, η αποτελεσματικότητα των μεθόδων αυτών αξιολογείται σε συνθετικά και σε δύο πραγματικά σύνολα δεδομένων. Συγκεκριμένα, τα δύο πραγματικά σύνολα δεδομένων αποτελούνται από το ερωτηματολόγιο Humor Style Questionnaire που βασίζεται στο μοντέλο χιούμορ των R. A. Martin et al. (2003) και το Big Five Personality Τest, ένα από τα πιο γνωστά σύνολα δεδομένων στον τομέα της ψυχολογίας.Τεκμήριο Clustering mixed type data(21-09-2022) Παγκράτη, Κυριακή; Pagkrati, Kyriaki; Athens University of Economics and Business, Department of Statistics; Karlis, Dimitrios; Papageorgiou, Ioulia; Papastamoulis, PanagiotisΗ ομαδοποίηση σε δεδομένα μικτού τύπου λαμβάνει αυξανόμενη προσοχή τα τελευταία χρόνια, λόγω του ότι συνδυασμοί αριθμητικών και κατηγορικών δεδομένων συναντώνται συχνότερα στις περισσότερες επιχειρηματικές εφαρμογές σήμερα. Σκοπός της συγκεκριμένης εργασίας είναι η ανασκόπηση της σχετικής βιβλιογραφίας (Foss et al., 2016; Foss and Markatou, 2018; Szepannek, 2018; McParland and Gormley, 2016; Marbac et al., 2015) και η σύγκριση των αντίστοιχων τεχνικών ομαδοποίησης όσον αφορά την ακρίβεια αλλά και τον υπολογιστικό τους χρόνο, μέσω της χρήσης προσομοιωμένων σετ δεδομένων. Τα μέτρα ακρίβειας που χρησιμοποιήθηκαν είναι τα ARI (Adjusted Rand Index), RI (Rand Index), J (Jaccard Index) και FM (Fowlkes-Mallows Index). Για τον υπολογιστικό χρόνο έγινε χρήση της συνάρτησης microbenchmark στην R. Όταν το ποσοστό της επικάλυψης μεταξύ των πραγματικών ομάδων ήταν μικρό, τόσο στις συνεχείς όσο και στις κατηγορικές μεταβλητές, όλες οι μέθοδοι φάνηκε να παρουσιάζουν πολύ καλά αποτελέσματα και οι ομάδες εντοπίζονταν με ευκολία. Στην περίπτωση που το σετ δεδομένων αποτελούνταν από μικρότερο αριθμό μεταβλητών (δύο συνεχείς και δύο κατηγορικές), οι τεχνικές των KAMILA και clustMixType δεν απέδωσαν ικανοποιητικά όταν το ποσοστό των επικαλύψεων μεταξύ των πραγματικών ομάδων στις συνεχείς μεταβλητές ήταν υψηλό, αλλά δεν συνέβη το ίδιο όταν τα υψηλά ποσοστά επικαλύψεων στις πραγματικές ομάδες επηρέαζαν τις κατηγορικές μεταβλητές του σετ δεδομένων. Σε αυτές τις συνθήκες οι τεχνικές των clustMD και MixCluster φάνηκαν ανώτερες των KAMILA και clustMixType. Η επίδοση των clustMD και MixCluster παρουσιάστηκε κατώτερη όταν υπήρχε κάποιου βαθμού επικάλυψη και στις τέσσερις μεταβλητές του σετ δεδομένων, ενώ ταυτόχρονα στις δύο από αυτές, ανεξαρτήτως του τύπου τους, το ποσοστό αυτό ήταν υψηλό (70%). Όταν ο αριθμός των μεταβλητών στο σετ δεδομένων διπλασιάστηκε (από τέσσερις σε οκτώ- τέσσερις συνεχείς και τέσσερις κατηγορικές), όλες οι μέθοδοι απέδωσαν άριστα, ακόμα και στην συνθήκη όπου στις τρείς από τις τέσσερις συνεχείς και κατηγορικές μεταβλητές εφαρμόστηκε υψηλό ποσοστό επικάλυψης μεταξύ των πραγματικών ομάδων. Όσον αφορά τον υπολογιστικό χρόνο, οι τεχνικές στα clustMD και MixCluster φάνηκαν περισσότερο χρονοβόρες συγκριτικά με εκείνες των KAMILA και clustMixType. Τέλος, οι τεχνικές αυτές δοκιμάστηκαν και σε τρία πραγματικά σετ δεδομένων, προκειμένου να αξιολογήσουμε περαιτέρω τη συμπεριφορά τους.Τεκμήριο Fast-moving consumer goods (FMCG) product similarities evaluation and visualization based on customer transaction sales(2021) Kostopoulou, Frideriki D.; Κωστοπούλου, Φρειδερίκη Δ.; Athens University of Economics and Business, Department of Statistics; Karlis, Dimitrios; Pedeli, Xanthi; Papastamoulis, PanagiotisIn the retail, market basket analysis is a set of statistical affinity calculations that facilitate shop owners more completely comprehend, and ultimately serve,their clients by highlighting purchasing patterns. The idea is that combinations of products most frequently occur together in orders, namely, customers who purchase a certain item (or group of items) are more likely to purchase another specific item (or group of items). The goal of this dissertation is to discover and visualize possible measures of similarity of FMCG products in the category of “juices” based on the annual transaction data of the customers. Our approach is based on examining pairs of goods and constructing models that we could evaluate them. After construction of models, in the second part, we classify both juices and consumers into reasonable groups. Finally, it is presented the overall conclusions of the dissertation.Τεκμήριο Popularity and usage of statistical - data science software(01-02-2023) Κιρίλλοβ, Κωνσταντίνος; Kirillov, Konstantinos; Athens University of Economics and Business, Department of Statistics; Pedeli, Xanthi; Karlis, Dimitrios; Papastamoulis, PanagiotisΣτόχος αυτής της εργασίας είναι η συλλογή, η παρουσίαση και η ανάλυση της δημοτικότητας των στατιστικών εργαλείων που επιλέχθηκαν στα πλαίσια της έρευνας. Στην αρχή παρουσιάζεται η θεωρία που θα χρησιμοποιηθεί στα επόμενα κεφάλαια. Μετά από αυτό, ακολουθεί μια σύντομη συζήτηση για πώς συλλέχθηκαν τα δεδομένα. Αφού ολοκληρωθεί η συγκέντρωση των δεδομένων, ακολουθεί μια εκτενής ανάλυση του συνόλου δεδομένων και των μεταβλητών του. Στη συνέχεια γίνεται προσπάθεια ομαδοποίησης των συγκεντρωμένων παρατηρήσεις, χρησιμοποιώντας τεχνικές που στοχεύουν στη ομαδοποίηση για δυαδικά δεδομένα. Και τέλος, το σύνολο δεδομένων συλλέγεται ξανά μέσω μιας συτόματης διαδικασίας και τα νέα δεδομένα συγκρίνονται με τα παλιά.Τεκμήριο Statistical models for natural language processing and topic modelling in R(17-09-2024) Καβούρ, Ευθύμιος-Ιωάννης; Kavour, Efthimios-Ioannis; Athens University of Economics and Business, Department of Statistics; Papageorgiou, Ioulia; Pedeli, Xanthi; Papastamoulis, PanagiotisΣκοπός της παρούσας διπλωματικής εργασίας είναι η εις βάθος ανάλυση και εφαρμογή της μεθόδου Latent Dirichlet Allocation (LDA), η οποία επιτρέπει την κατηγοριοποίηση λεκτικών δεδομένων σε θεματικές ομάδες. Αρχικά, παρουσιάζεται μια συνοπτική εισαγωγή στη μηχανική μάθηση, ακολουθούμενη από λεπτομερή μελέτη του μοντέλου ενδιαφέροντος. Τέλος, η μέθοδος εφαρμόζεται σε μια συλλογή βιβλίων, με σκοπό την ανάλυση και κατηγοριοποίηση των περιγραφών τους.