Μεταπτυχιακές Εργασίες
Μόνιμο URI για αυτήν τη συλλογήhttps://pyxida.aueb.gr/handle/123456789/15
Περιήγηση
Πρόσφατες Υποβολές
Τεκμήριο Flexible survival modelling with incorporation of external information for robust long-term extrapolations(2025-04-11) Καλατζή, Μαριλένα; Kalatzi, Marilena; Karlis, Dimitrios; Ntzoufras, Ioannis; Demiris, NikolaosΟι Αξιολογήσεις Τεχνολογιών Υγείας (HTAs) έχουν κρίσιμο ρόλο στην αξιολόγηση νέων ιατρικών παρεμβάσεων. Τα μακροχρόνια δεδομένα είναι απαραίτητα για αξιόπιστες αποφάσεις, καθώς η περίοδος παρακολούθησης των μελετών, ιδίως σε μελέτες σχετικές με την ογκολογία, είναι συχνά περιορισμένη. Η παρεκβολή είναι επομένως σημαντική για τη διαμόρφωση πολιτικών υγείας και τη μοντελοποίηση του κόστους αποτελεσματικότητας. Συμβάλλει στην ολοκληρωμένη κατανόηση των πιθανών ωφελειών και κινδύνων μιας θεραπείας, διασφαλίζοντας ότι οι αποφάσεις στον τομέα της υγείας βασίζονται σε ισχυρά και αξιόπιστα δεδομένα. Τα παραδοσιακά παραμετρικά μοντέλα επιβίωσης, καθώς και οι ευέλικτες παραμετρικές προσεγγίσεις, χρησιμοποιούνται ευρέως για την παρεκβολή των δεδομένων. Ωστόσο, συχνά παράγουν κλινικά, μη ρεαλιστικά αποτελέσματα. Η παρούσα διατριβή διερευνά μια νέα προσέγγιση για την παρεκβολή των δεδομέων επιβίωσης, χρησιμοποιώντας M-splines που ενσωματώνουν εξωτερικά δεδομένα μέσα σε ένα μπεϋζιανό πλαίσιο. Τα M-splines εφαρμόζονται στη συνάρτηση κινδύνου, με την ευελιξία τους να καθορίζεται από ασθενώς πληροφοριακές εκ των προτέρων κατανομές και την τοποθεσία των κόμβων. Για την αποφυγή της υπερπροσαρμογής, το μοντέλο αρχικά περιλαμβάνει ένα μεγάλο αριθμό κόμβων, οι οποίοι μειώνονται κατά τη διαδικασία προσαρμογής του μοντέλου μέχρι να επιτευχθεί το κατάλληλο επίπεδο ευελιξίας. Διάφορες πηγές εξωτερικής πληροφορίας μπορούν να συνδυαστούν από κοινού με τα δεδομένα της κλινικής δοκιμής, βελτιώνοντας την ακρίβεια της παρεκβολής, ενώ παράλληλα συμβάλουν στην παραγωγή κλινικά ρεαλιστικών εκτιμήσεων για μακροπρόθεσμο χρονικό διάστημα. Η νέα μεθοδολογία, μαζί με τα συμβατικά μοντέλα που χρησιμοποιούνται για την παρεκβολή, εφαρμόστηκαν σε ένα πραγματικό σύνολο δεδομένων επιβίωσης σε ασθενείς με μη μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC). Τα αποτελέσματα της ανάλυσης αναδεικνύουν την αποτελεσματικότητα της νέας προσέγγισης. Οι μέσες εκτιμήσεις της πενταετούς επιβίωσης ήταν σε συμφωνία με τις τιμές που βασίζονται στη βιβλιογραφία, ενώ παράλληλα ήταν αξιόπιστες, όπως υποδεικνύεται από τα σχετικά στενά διαστήματα αξιοπιστίας. Συγκρίνοντας τα έτη ζωής που εκτιμήθηκαν για τις δύο ομάδες θεραπείας, παρατηρήθηκε σημαντική διαφορά στις εκτιμήσεις των δύο προσεγγίσεων. Τα μοντέλα που χρησιμοποιούν M-splines εκτίμησαν πέντε επιπλέον μήνες ζωής, σε σύγκριση με μόλις ένα μήνα από τα τυπικά παραμετρικά μοντέλα. Αυτή η απόκλιση αναδεικνύει τις προκλήσεις που αντιμετωπίζουν τα τελευταία μοντέλα, τα οποία δεν συνέκλιναν στο μηδέν μετά από εκτεταμένη χρονική περίοδο, επηρεάζοντας έτσι τις μέσες εκτιμήσεις. Τα ευρήματα της έρευνας αυτής, αναδεικνύουν τη σημασία των ευέλικτων μοντέλων επιβίωσης που ενσωματώνουν εξωτερικές πηγές δεδομένων στις αξιολογήσεις της υγειονομικής περίθαλψης. Αν και οι δύο μέθοδοι που εφαρμόστηκαν δεν μπορούν να συγκριθούν με στατιστικά κριτήρια, η νέα προσέγγιση ενισχύει τη σταθερότητα και την αξιοπιστία των μακροπρόθεσμων προβλέψεων, καθιστώντας την ένα πολύτιμο εργαλείο στις οικονομικές αξιολογήσεις της υγείας.Τεκμήριο Κίνηση Brown(2025-04-03) Ζυγάς, Σωτήριος; Γιαννακόπουλος, Αθανάσιος; Ζαζάνης, Μιχαήλ; Βακερούδης, ΣταύροςΗ παρούσα Διπλωματική εργασία ασχολείται με την Κίνηση Brown, μία από τις πιο σημαντικές στοχαστικές διαδικασίες στη θεωρία πιθανοτήτων και τη μαθηματική χρηματοοικονομική. Αρχικά, γίνεται ανάλυση των στοχαστικών διαδικασιών, των martingales και της δεσμευμένης μέσης τιμής ως προς τους ορισμούς και τις ιδιότητες τους που αποτελούν θεμελιώδη εργαλεία για τη μελέτη της. Στη συνέχεια, παρουσιάζονται οι βασικές έννοιες και ιδιότητες της Κίνησης Brown, καθώς και η ιστορική της αναδρομή. Ειδική έμφαση δίνεται στο Ολοκλήρωμα Itô και στον τύπο του Itô, που επιτρέπουν τη μαθηματική περιγραφή της εξέλιξης τυχαίων φαινομένων. Επιπλέον, παρουσιάζεται η εφαρμογή της Κίνησης Brown στη χρηματοοικονομική, με επίκεντρο το μοντέλο Black-Scholes για την τιμολόγηση δικαιωμάτων προαίρεσης. Τέλος, εξετάζονται οι πρακτικές εφαρμογές της Κίνησης Brown σε διάφορους τομείς, όπως η φυσική, η βιολογία, η ανάλυση ιατρικών εικόνων και η τυχαία πλοήγηση ρομποτικών συστημάτων. Η εργασία ολοκληρώνεται με βιβλιογραφική ανασκόπηση και επίλογο που αναδεικνύουν τη σημασία της Κίνησης Brown στην ανάλυση και μοντελοποίηση στοχαστικών διαδικασιών.Τεκμήριο Bayesian ANOVA and multiplicity adjustment(2025-03-21) Μαμούγκα, Άλκηστη; Mamougka, Alkisti; Papastamoulis, Panagiotis; Tsiamyrtzis, Panagiotis; Ntzoufras, IoannisΗ παρούσα διατριβή εξετάζει τη Bayesian ANOVA ως εναλλακτική προσέγγιση έναντι των κλασικών μεθόδων, εστιάζοντας στα πλεονεκτήματά της στη διαχείριση πολλαπλών συγκρίσεων και την αξιοποίηση της α πριόρι πληροφορίας. Οι παραδοσιακές μέθοδοι ANOVA βασίζονται στα p-value και απαιτούν αυθαίρετες διορθώσεις πολυπλοκότητας, όπως η Bonferroni, προκειμένου να ελεγχθεί ο κίνδυνος ψευδών ανακαλύψεων. Αντίθετα, η Μπεϋζιανή ANOVA ενσωματώνει φυσικά τη διόρθωση πολυπλοκότητας μέσω των εκ των προτέρων κατανομών. Το κυριότερο κομμάτι της μελέτης βασίζεται σε μια προσομοίωση, στην οποία εφαρμόζουμε Bayesian ANOVA με διαφορετικές επιλογές α πριόρι κατανομών. Εξετάζουμε την επίδραση των κατανομών αυτών στην επιλογή μοντέλου, την ακρίβεια των συμπερασμάτων και τη διαχείριση των πολλαπλών συγκρίσεων. Επιπλέον, διερευνούμε την εφαρμογή της Bayesian ANOVA σε πραγματικά δεδομένα, εστιάζοντας σε παράγοντες που επηρεάζουν την απόδοση των αθλητών στον μαραθώνιο. Τα αποτελέσματα αναδεικνύουν τη Bayesian ANOVA ως μια πιο ευέλικτη και πληροφοριακά πλουσιότερη προσέγγιση στην ανάλυση διακύμανσης, η οποία αντιμετωπίζει τη διόρθωση πολυπλοκότητας εγγενώς, χωρίς την ανάγκη αυθαίρετων προσαρμογών. Με τη βελτίωση της επιλογής μοντέλου και τον περιορισμό του κινδύνου ψευδών ανακαλύψεων, η Bayesian προσέγγιση καθίσταται μια ισχυρή εναλλακτική των κλασικών μεθόδων, ενισχύοντας την υιοθέτηση Μπεϋζιανών τεχνικών στη στατιστική ανάλυση και την εφαρμοσμένη έρευνα.Τεκμήριο Credit rating and migration modelling(2025-04-02) Κοντογιάννης, Γεράσιμος; Βακερούδης, Σταύρος; Ζυμπίδης, Αλέξανδρος; Γιαννακόπουλος, ΑθανάσιοςΗ εργασία αυτή αποτελεί μία προσπάθεια να απαντήσουμε σε ερωτήματα που έχουν απασχολήσει στο παρελθόν (ή και απασχολούν ακόμη) όσους ενασχολούνται με την εκτίμηση της πιστοληπτικής ικανότητας επιχειρήσεων: Πώς μπορούμε να εκτιμήσουμε την πιθανότητα μία επιχείρηση να μην δύναται να εξυπηρετήσει τις υποχρεώσεις της στο άμεσο ή και στο μακρινό μέλλον; Τα οικονομικά μεγέθη ενός ισολογισμού λένε πάντα την αλήθεια; Είναι ικανός ο ισολογισμός μίας χρονιάς να μας προετοιμάσει για το τι θα συμβεί την «επόμενη μέρα»; Εάν ναι, βάσει ποιων στοιχείων μπορεί να γίνει αυτό; Είναι κάποια από τα οικονομικά στοιχεία σημαντικότερα από κάποια άλλα; Στα παραπάνω ερωτήματα θα επιχειρήσουμε να απαντήσουμε κάνοντας χρήση μεθόδων clustering, logistic regression models και πινάκων πιθανοτήτων μετάβασης. Θα βασιστούμε σε στοιχεία δημοσιευμένων ισολογισμών 180 επιχειρήσεων, οι οποίες εδρεύουν στην Ευρώπη, σε συνδυασμό με εκτιμήσεις Εταιρείας η οποία εκτιμά την πιστοληπτική ικανότητα αυτών των επιχειρήσεων. Μέσω μεθόδων Clustering θα επιχειρήσουμε να δούμε εάν προκύπτουν συσχετίσεις μέσα από τα στοιχεία ενός ισολογισμού και εάν ομαδοποιώντας κάποια στοιχεία θα έχουμε κάποιο υποσύνολο μεταβλητών που αξίζει να αναλύσουμε περαιτέρω. Έχοντας μία πρώτη εικόνα από την παραπάνω διαδικασία, θα συνεχίσουμε την ανάλυση με χρήση Logistic Regression Models. Εκεί θα διαπιστώσουμε εάν υπάρχουν κάποια στοιχεία τα οποία είναι πιο σημαντικά από άλλα στην προσπάθεια κατηγοριοποίησης μίας επιχείρησης σε κάποιο rating class. Θα μπορέσουμε επίσης να δούμε ποιοι είναι οι συντελεστές εκείνοι που θα μας δίνανε σε ένα μοντέλο τη δυνατότητα εκτίμησης, ίσως και πρόβλεψης του rating. Τέλος με τη χρήση των πινάκων πιθανοτήτων μετάβασης, θα μπορέσουμε να διαπιστώσουμε εάν η γνωστή μεταβολή στο rating μιας επιχείρησης για ένα οικονομικό έτος είναι ικανή να προβλέψει τι θα συμβεί στο μέλλον, στην επόμενη οικονομική περίοδο ή ακόμα και σε βάθος ετών. Σε αυτή τη διαδικασία θα βασιστούμε στη θεωρία των Μαρκοβιανών Αλυσίδων. Όλες οι παραπάνω διαδικασίες θα υλοποιηθούν με το στατιστικό πρόγραμμα “R”.Τεκμήριο Στατιστική ανάλυση του δείκτη γεωργικού εισοδήματος και του ποσοστού συμμετοχής του πρωτογενούς τομέα στο ΑΕΠ με μεθόδους χρονολογικών σειρών(31-01-2004) Σπανέλλης, Λεωνίδας; Λειβαδά, ΑλεξάνδραΗ Κοινή Αγροτική Πολιτική (ΚΑΠ) αποτελείται από σύνολο κανόνων και μηχανισμών, που ρυθμίζουν την παραγωγή, το εμπόριο και την επεξεργασία των γεωργικών προϊόντων στην Ευρωπαϊκή Ένωση (ΕΕ), δίνοντας όλο και μεγαλύτερη προσοχή στην ανάπτυξη της υπαίθρου. Η ΚΑΠ θεωρείται ως ένας από τους πιο σημαντικούς τομείς πολιτικής στην ΕΕ και της οποίας ένας επίσης πολύ σημαντικός στόχος είναι να εξασφαλίζει ένα δίκαιο βιοτικό επίπεδο στον γεωργικό πληθυσμό, ιδίως με την αύξηση του ατομικού εισοδήματος των εργαζομένων στη γεωργία. Συνεπώς, η εφαρμογή της ΚΑΠ επηρεάζει ουσιαστικά το Γεωργικό Εισόδημα και στην Ελλάδα. Η παρούσα διατριβή επικεντρώνεται κυρίως στο πως και πόσο ακριβώς, οι μεταβλητές που διαμορφώνουν τον δείκτη του κατά κεφαλήν γεωργικού εισοδήματος, επηρέασαν την εξέλιξη του εν λόγω δείκτη στην Ελλάδα κατά την περίοδο 1973-1998. Η κατασκευή ενός τέτοιου μοντέλου μας οδηγεί σε προβλέψεις. Σε αυτό το μακροοικονομικό πλαίσιο μελετάται επίσης και η εξέλιξη του ποσοστού συμμετοχής του Πρωτογενούς Τομέα της οικονομίας (Γεωργία και Κτηνοτροφία) στο Ακαθάριστο Εγχώριο Προϊόν της Ελλάδας, κατά την περίοδο 1960-1997. Τεχνικές διαχωριστικής ανάλυσης, μέθοδοι εξομαλύνσεων, εκτιμήσεις και έλεγχοι αυτοπαλίνδρομων ολοκληρωμένων υποδειγμάτων κινητών μέσων (με εξωγενείς μεταβλητές σε μια περίπτωση) των Box-Jenkins, είναι οι μεθοδολογίες που εφαρμόζονται στην διατριβή αυτή μέσα στο επιστημονικό πεδίο της ανάλυσης και μοντελοποίησης χρονολογικών σειρών.Τεκμήριο Πρόβλεψη του τύπου μηχανικού αερισμού βρεφών με βρογχιολίτιδα με εφαρμογή πολυμεταβλητής στατιστικής ανάλυσης σε πραγματικά ιατρικά δεδομένα(30-12-2014) Πρεζεράκου, Αναργυρούλα; Παπαγεωργίου, ΙουλίαΗ πολυμεταβλητή ανάλυση αποτελείται από ένα σύνολο πολύ χρήσιμων στατιστικών μεθόδων που παρέχουν τη δυνατότητα στατιστικής ανάλυσης και συμπερασματολογίας δεδομένων ιδιαίτερα συσχετισμένα μεταξύ τους. Οι μέθοδοι της πολυμεταβλητής στατιστικής ανάλυσης xρησιμοποιούνται ευρύτατα από πολλές επιστήμες, συμπεριλαμβανομένης και της ιατρικής, όπου τα συλλεγόμενα δεδομένα είναι από τη φύση τους σχεδόν πάντα έντονα συσχετισμένα μεταξύ τους, ιδίως όταν λαμβάνονται από βαρέως πάσχοντες ασθενείς. Αναλύονται θεωρητικά τρεις μέθοδοι πολυμεταβλητής ανάλυσης, η Ανάλυση σε Κύριες Συνιστώσες, η Παραγοντική Ανάλυση και η Διαχωριστική Ανάλυση και στη συνέχεια χρησιμοποιείται η Διαχωριστική Ανάλυση για την πρόβλεψη του τύπου μηχανικού αερισμού που θα χρειαστούν τα βρέφη με οξεία βρογχιολίτιδα που θα εισαχθούν στην Μονάδα Εντατικής Θεραπείας.Τεκμήριο Προσομοίωση γραμμών παραγωγής με πεπερασμένες χωρητικότητες και παρεμπόδιση(27-05-2016) Γκάιδας, Νίκος; Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Στατιστικής; Μπουρνέτας, ΑπόστολοςΗ ανάπτυξη της παρακάτω διπλωματικής εργασίας έγινε μέσα από 2 κεφάλαια. Στο πρώτο κεφάλαιο κεφάλαιο, έγινε προσπάθεια να μελετηθεί η γραμμή παραγωγής στην οποία υπάρχει μπλοκάρισμα υπό την χρήση της μεθόδου της προσομοίωσης. Αρχικά, έγινε απλή περιγραφή μίας τυπικής προσομοίωσης, καθώς και των βασικών σταδίων που θα μπορούσαμε να συναντήσουμε σε αυτή. Στη συνέχεια, αναλύσαμε την διαδικασία της μοντελοποίησης των συστημάτων που μας ενδιαφέρουν και παρατηρήσαμε τις διάφορες μορφές των υποδειγμάτων που προκύπτουν. Σε αυτό το σημείο έγινε αναφορά στα αναλυτικά υποδείγματα και στα υποδείγματαπροσομοίωσης, καθώς και η σύγκριση αυτών των δύο μορφών υποδειγμάτων. Έπειτα, δόθηκε μία πλήρης περιγραφή της διαδικασίας μέσω της οποίας γίνεται η μοντελοποίηση και η ανάλυση με βάση την προσομοίωση, καθώς και των βημάτων που απαιτούνται για την σωστή και ακριβή κατασκευή ενός οποιουδήποτε τέτοιου μοντέλου που θα επιθυμούσαμε να έχουμε στην διάθεσή μας.Τεκμήριο Modeling financial data(20-09-2016) Apergis, Iraklis; Απέργης, Ηρακλής; Athens University of Economics and Business, Department of StatisticsThe modeling of a price process associated with one or more commodities is offundamental importance not only in the valuation of a variety of instruments andthe derivatives associated with these commodities, but also in the formulation ofoptimization and equilibrium models, aimed at finding optimal extraction and/orstorage strategies, that are bound to involve these prices as parameters.Τεκμήριο Διεθνής εμπειρία επί των ασφαλιστικών-συνταξιοδοτικών συστημάτων, η ελληνική περίπτωση : σύστημα & στοιχεία παροχών συντάξεων, προοπτικές-συμπεράσματα(30-04-2013) Οικονομίδης, Κωνσταντίνος; Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα ΣτατιστικήςΟ θεσμός της κοινωνικής ασφάλισης, αποτελεί μέρος των επιδιώξεων του σύγχρονου κοινωνικού κράτους για την κοινωνική προστασία των πολιτών, στα πλαίσια άσκησης της εθνικής κοινωνικής πολιτικής του. Η βασική αρχή του κοινωνικού κράτους και της κοινωνικής πολιτικής είναι η συνολική κοινωνική αλληλεγγύη, δημόσιου ή ιδιωτικού χαρακτήρα. Πρόκειται για ένα θεσμό ο οποίος απέκτησε τη σημερινή δυναμική μορφή του μετά το δεύτερο παγκόσμιο πόλεμο, οπότε αναγνωρίστηκε στο κράτος ένας ευρύτερος κοινωνικός ρόλος, με έμφαση της οικονομικής πολιτικής σε αναδιανεμητικούς στόχους. Με τις πολλαπλές λειτουργίες της κοινωνικής ασφάλισης επιτελείται μια μεγάλης έκτασης μετατόπιση της αγοραστικής δύναμης, από τον οικονομικά ενεργό στο μη ενεργό πληθυσμό, από τους υγιείς στους ασθενείς, από τα υψηλότερα στα χαμηλότερα εισοδήματα. Το δικαίωμα της ασφαλιστικής προστασίας είναι κατοχυρωμένο συνταγματικά και σε κάθε χώρα υλοποιείται με διαφορετικό τρόπο, ανάλογα με το πολιτικό και οικονομικό επίπεδο, το επίπεδο ανάπτυξης, τις εθνικές παραδόσεις, τις προτεραιότητες και τη φιλοσοφία της. Παρά τις επιμέρους διαφορές, όμως, τόσο στην κοινωνική, όσο και στην πολιτική οργάνωση των χωρών, παρατηρείται γενικά σύγκλιση των ευρύτερων επιδιώξεων και των τελικών στόχων.Τεκμήριο Microarray data analysis(2025-03-13) Κασιάν-Παναγιωτοπούλου, Αλίνα; Kasian-Panagiotopoulou, Alina; Demiris, Nikolaos; Pedeli, Xanthi; Papastamoulis, PanagiotisΗ τεχνολογία μικροσυστοιχιών έχει φέρει επανάσταση στον τομέα της γονιδιωματικής, επιτρέποντας την ποσοτική μέτρηση των επιπέδων έκφρασης χιλιάδων γονιδίων σε ένα μόνο πείραμα. Αυτή η τεχνολογία υψηλής διαπερατότητας υπήρξε καθοριστική για την κατανόηση βιολογικών διεργασιών, την αναγνώριση βιοδεικτών για ασθένειες και τη μελέτη μοριακών μονοπατιών πολλών καταστάσεων. Ωστόσο, η ανάλυση δεδομένων μικροσυστοιχιών, αν και εξαιρετικά ισχυρή, συνοδεύεται από σοβαρά στατιστικά προβλήματα λόγω της υψηλής διάστασης των δεδομένων, της εγγενούς μεταβλητότητας και της ανάγκης για ανθεκτικές μεθόδους που να μπορούν να εξάγουν ουσιαστικές βιολογικές πληροφορίες. Μία από τις σημαντικότερες προκλήσεις στην ανάλυση δεδομένων μικροσυστοιχιών είναι αυτή των πολλαπλών υποθέσεων. Με χιλιάδες γονίδια να εξετάζονται ταυτόχρονα για διαφορική έκφραση, η εφαρμογή παραδοσιακών στατιστικών μεθόδων οδηγεί σε αύξηση των ψευδώς θετικών ευρημάτων, γεγονός που καθιστά αναγκαία τη χρήση διορθώσεων που εξισορροπούν το πλήθος των ψευδών ανακαλύψεων με τη στατιστική ισχύ. Η προσέγγιση του Ρυθμού Ψευδών Ανακαλύψεων (False Discovery Rate - FDR) των Benjamini και Hochberg (1995) αποτελεί μία από τις πιο διαδεδομένες μεθόδους για τη ρύθμιση των ψευδών θετικών αποτελεσμάτων και την επίτευξη υψηλής ευαισθησίας. Στην παρούσα διπλωματική εργασία εξετάζονται διάφορες μέθοδοι ελέγχου πολλαπλών υποθέσεων, από τις ιδιαίτερα συντηρητικές παραδοσιακές προσεγγίσεις όπως η διόρθωση Bonferroni έως τις πλέον σύγχρονες και εξελιγμένες στρατηγικές βασισμένες στο FDR, και αξιολογείται η εφαρμογή τους σε δεδομένα μικροσυστοιχιών. Ένα ακόμη κεντρικό ζήτημα στην ανάλυση μικροσυστοιχιών αποτελεί η αναγνώριση διαφορετικά εκφραζόμενων γονιδίων (Differentially Expressed – DE). Το πακέτο limma, το οποίο βασίζεται σε γραμμικά μοντέλα και εμπειρική εξομάλυνση της διασποράς μέσω Bayes, έχει καθιερωθεί ως πρότυπο για την ανίχνευση διαφορικής έκφρασης σε μελέτες μικροσυστοιχιών. Στην παρούσα εργασία, το limma συγκρίνεται με τα παραδοσιακά t-tests και η απόδοσή τους αξιολογείται υπό διάφορες συνθήκες, όπως διαφορετικά μεγέθη επίδρασης, δείγματος και επίπεδα θορύβου. Μέσω διαφορετικών σεναρίων προσομοίωσης και εφαρμογής των μεθόδων σε πραγματικά δεδομένα μικροσυστοιχιών, αναδεικνύονται τα πλεονεκτήματα των εμπειρικών μεθόδων Bayes όσον αφορά τη μείωση της αβεβαιότητας στην εκτίμηση της διασποράς και την αύξηση της στατιστικής ισχύος. Πέρα από την ανάλυση διαφορικής έκφρασης, το clustering παίζει καθοριστικό ρόλο στην αναγνώριση προτύπων στα γονιδιακά δεδομένα έκφρασης. Οι παραδοσιακές μέθοδοι, όπως hierachical clustering και το k-means, χρησιμοποιούνται ευρέως αλλά παρουσιάζουν σημαντικούς περιορισμούς, όπως ευαισθησία στο θόρυβο και αδυναμία προσδιορισμού του βέλτιστου αριθμού clusters. Για την αντιμετώπιση αυτών των προκλήσεων, χρησιμοποιούνται μεθοδολογίες βασισμένες σε μοντέλα όπως τα Gaussian Mixture Models - GMMs και προχωρημένες Bayesian προσεγγίσεις όπως το PUMA-CLUST, οι οποίες προσφέρουν ένα μαθηματικό πλαίσιο για την ανάλυση clusters σε δεδομένα μικροσυστοιχιών. Στην εργασία αυτή εξετάζονται διάφορες τεχνικές clustering, αξιολογείται η απόδοσή τους υπό διαφορετικές συνθήκες και αναδεικνύεται η συμβολή των πιθανοθεωρητικών μοντέλων στη βελτίωση της σταθερότητας και της ερμηνευσιμότητας των clusters. Συνολικά, η εργασία παρουσιάζει μία εκτενή επισκόπηση στατιστικών και υπολογιστικών μεθόδων για την ανάλυση δεδομένων μικροσυστοιχιών, καλύπτοντας τις θεματικές των πολλαπλών υποθέσεων, της διαφορικής έκφρασης και του clustering. Μέσα από τον συνδυασμό θεωρίας και εφαρμογής, αποσαφηνίζονται τα πλεονεκτήματα και οι περιορισμοί κάθε μεθόδου, προσφέροντας ένα δομημένο πλαίσιο για την ανάλυση υψηλής διάστασης γονιδιακών εκφράσεων. Τα συμπεράσματα της εργασίας συμβάλλουν στην ανάπτυξη πιο αξιόπιστων και ισχυρών μεθοδολογιών για την εξαγωγή βιολογικά ερμηνεύσιμων πληροφοριών από πειράματα μικροσυστοιχιών.Τεκμήριο Εγκυρότητα και αξιοπιστία των ψηφιακών βιοδεικτών για τη μετωποκροταφική άνοια(2025-03-27) Stylidis, Ioannis; Στυλίδης, Ιωάννης; Kornak, John; Spelta, Alessandro; Ntzoufras, IoannisΗ μετωποκροταφική άνοια είναι μια νευρολογική πάθηση που απασχολεί την ανθρωπότητα για μεγάλο χρονικό διάστημα. Οι ασθενείς με αυτή την πάθηση υποφέρουν από διάφορες συνέπειες, όπως γνωστική δυσλειτουργία, κινητικά προβλήματα και συναισθηματική αναστάτωση. Δυστυχώς, δεν υπάρχει μόνιμη θεραπεία για αυτήν. Επομένως, η αναζήτηση τρόπων για τη συλλογή περισσότερων δεδομένων θα ήταν εξαιρετικά χρήσιμη στην αντιμετώπιση αυτού του προβλήματος. Ως απάντηση, έχει αναπτυχθεί μια εφαρμογή κινητού (ALLFTDMobileApp), η οποία έχει ως στόχο να προσομοιώσει τα δεδομένα που συλλέγονται από διαγνωστικά τεστ. Αυτή η εφαρμογή περιλαμβάνει παιχνίδια κινητού σχεδιασμένα για να αξιολογούν τη γνωστική λειτουργία των ασθενών, τα οποία μπορεί να παρέχουν πληροφορίες για το επίπεδο της άνοιας στους ασθενείς. Συλλέγοντας περισσότερα δεδομένα από τους ασθενείς, η εφαρμογή αυτή διευκολύνει τις ερευνητικές προσπάθειες που αποσκοπούν στην εύρεση θεραπείας και στην καλύτερη πρόβλεψη της σοβαρότητας της νόσου στους ασθενείς. Στην ανάλυσή μας, θα αποδείξουμε ότι αυτή η εφαρμογή κινητού έχει τη δυνατότητα να αντικαταστήσει ορισμένα διαγνωστικά τεστ που συνήθως πραγματοποιούνται στα νοσοκομεία, επιτρέποντας στους ασθενείς να υποβληθούν σε λιγότερες διαδικασίες. Αυτό θα επιτευχθεί χρησιμοποιώντας δεδομένα από τις επιδόσεις των παιχνιδιών με την πάροδο του χρόνου από τους συμμετέχοντες και αξιολογώντας τη συσχέτισή τους με διαγνωστικά τεστ, όπως οι όγκοι περιοχών του εγκεφάλου από εγκεφαλικές απεικονίσεις. Στη μελέτη αυτή, θα χρησιμοποιηθούν δύο τεχνικές — Μοντέλα Μικτών Επιδράσεων και Μοντελοποίηση Δομικών Εξισώσεων — για να αναλυθεί η σχέση μεταξύ των επιδόσεων στα παιχνίδια και των όγκων του εγκεφάλουΤεκμήριο Stochastic differential equations(2025-03-26) Tarasenko, Yulia; Zazanis, Michael; Yannacopoulos, Athanasios; Vakeroudis, StavrosStochastic differential equations serve as the foundation for many sections of applied sciences, such as mechanics, statistical physics, diffusion theory, cosmology, financial mathematics, economics, etc. The number of works devoted to various issues related to specific equations considered in individual areas of science listed above is very large. In this study, we consider only the general theory of stochastic differential equations, which is based on the approach initiated by K. Itô. In addition, we discuss simple analytical and numerical methods for solving such equations and, finally, we present an application in finance, namely, the Black and Scholes option price formula. In Chapter 1 we introduce basic notations and facts from the theory of stochastic processes, needed for the concept of Itô integrals in Chapter 2. In Section 1.2 we present the concept and some properties of Brownian motion which is one of the fundamental processes in mathematics and physics, as well as in natural science in general. In Chapter 2 we develop the Itô stochastic calculus, which has important applications in mathematical finance and stochastic differential equations. The theory of stochastic integration with respect to Brownian motion is developed in Section 2.1. In Section 2.2 we present the chain rule for stochastic calculus, commonly known, as the Itô formula. Chapter 3 returns to our main theme of stochastic differential equations. In this chapter, we present the stochastic differential equations, driven by Brownian motion, and the notions of strong and weak solutions. Section 3.1 is devoted to the theorem on the existence and uniqueness of a solution to a stochastic differential equation. In Section 3.2 we introduce the concept of a weak solution and the method for constructing such solutions by the Girsanov theorem. In Section 3.3 we give examples of stochastic differential equations and some analytical methods for solving them. In Section 3.4 we discuss two most popular numerical methods for solving (or simulating from) stochastic differential equations: the Euler-Maruyama method and the Milstein method. In Chapter 4 we introduce the necessary concepts from finance, and, finally, we present a proof of the Black-Scholes formula, which gives a theoretical estimate of the price of European-style options. Chapter 5 highlights areas for further research and perspectives.Τεκμήριο Popularity and usage of statistical - data science software(01-02-2023) Κιρίλλοβ, Κωνσταντίνος; Kirillov, Konstantinos; Athens University of Economics and Business, Department of Statistics; Pedeli, Xanthi; Karlis, Dimitrios; Papastamoulis, PanagiotisΣτόχος αυτής της εργασίας είναι η συλλογή, η παρουσίαση και η ανάλυση της δημοτικότητας των στατιστικών εργαλείων που επιλέχθηκαν στα πλαίσια της έρευνας. Στην αρχή παρουσιάζεται η θεωρία που θα χρησιμοποιηθεί στα επόμενα κεφάλαια. Μετά από αυτό, ακολουθεί μια σύντομη συζήτηση για πώς συλλέχθηκαν τα δεδομένα. Αφού ολοκληρωθεί η συγκέντρωση των δεδομένων, ακολουθεί μια εκτενής ανάλυση του συνόλου δεδομένων και των μεταβλητών του. Στη συνέχεια γίνεται προσπάθεια ομαδοποίησης των συγκεντρωμένων παρατηρήσεις, χρησιμοποιώντας τεχνικές που στοχεύουν στη ομαδοποίηση για δυαδικά δεδομένα. Και τέλος, το σύνολο δεδομένων συλλέγεται ξανά μέσω μιας συτόματης διαδικασίας και τα νέα δεδομένα συγκρίνονται με τα παλιά.Τεκμήριο Causal quests in aqueous research with Bayesian networks(31-08-2022) Καλαϊτζάκης, Νεκτάριος; Kalaitzakis, Nektarios; Athens University of Economics and Business, Department of Statistics; Tsagris, Michail; Ntzoufras, IoannisΤα υδατικά συστήματα χαρακτηρίζονται από υψηλή στοχαστικότητα, τεράστια πολυπλοκότητα και αβεβαιότητα. Το συνονθύλευμα αυτό ετερογενών φυσικών στοιχείων συχνά οδηγεί σε χαοτικά συστήματα τα οποία είναι εξαιρετικά δύσκολο να μοντελοποιηθούν και να προβλεφθούν με σχετική ακρίβεια. Οι κλασικές διαδικασίες μοντελοποίησης συχνά δυσκολεύονται να παρέχουν σαφείς ποσοτικές απαντήσεις, ενώ το μεγάλο πλήθος των συγχυτικών επιδράσεων πολύ συχνά οδηγεί σε παραπλανητικά συμπεράσματα, λανθασμένες αποφάσεις, κακές διαχειριστικές πρακτικές και σπατάλη κεφαλαίων. Σε αυτή τη διατριβή, υπογραμμίζουμε τη σημασία της ανάλυσης των συστημάτων αυτών μέσω της αιτιολογικής προσέγγισης και σκέψης, διερευνούμε την απόδοση τεχνικών αιτιακής μοντελοποίησης και μεθόδων όπως τα Bayesian Networks και προωθούμε την υιοθέτηση αυτών των μεθόδων ως κυρίαρχου τρόπου ανάλυσης στη λήψη αποφάσεων και στην περιβαλλοντική διαχείριση. Τα αποτελέσματα της έρευνάς μας ήταν σύμφωνα με την καθιερωμένη γνώση και την προηγούμενη έρευνα, ενώ κατέδειξε και τα ισχυρά πλεονεκτήματα της αιτιακής αναλυτικής συλλογιστικής στην έρευνα.Τεκμήριο Regression models for count data with excess zeros(25-01-2023) Φλωροπούλου, Ζωή; Floropoulou, Zoi; Athens University of Economics and Business, Department of Statistics; Vrontos, Ioannis; Psarakis, Stelios; Besbeas, PanagiotisΤα αριθμητικά δεδομένα από μετρήσεις χρησιμοποιούνται σε μια τεράστια ποικιλία επιστημονικών πεδίων. Στην πράξη, υπάρχουν περιπτώσεις συνόλων δεδομένων που περιέχουν πολύ μεγάλο αριθμό μηδενικών παρατηρήσεων σε σχέση με τις μη μηδενικές παρατηρήσεις. Για παράδειγμα, η ζήτηση για ιατρική περίθαλψη – όπως αποτυπώνεται από τον αριθμό των επισκέψεων εξωτερικών ασθενών σε ιατρεία και νοσοκομεία. Οι υπερβολικά πολλές μηδενικές παρατηρήσεις τείνουν να μην ενσωματώνονται επαρκώς και να μην επεξηγούνται από τις συνήθεις κατανομές όπως η Poisson, η διωνυμική και η αρνητική διωνυμική κατανομή. Επιπλέον, τα δεδομένα από μετρήσεις συχνά προκύπτουν σε συνδυασμό με επεξηγηματικές μεταβλητές. Σε αυτή τη διατριβή, διερευνούμε κατανομές όπως οι Zero-Inflated και Hurdle για μοντελοποίηση δεδομένων μέτρησης με υπερβολικά μηδενικά. Ένα Zero-Inflated μοντέλο είναι ένα στατιστικό μοντέλο που βασίζεται σε μίξη κατανομών με δύο components, ένα μηδενικό και ένα count component. Κάτω από αυτό το πλαίσιο, μια μηδενική παρατήρηση θα μπορούσε να προκύπτει από οποιοδήποτε component της μίξης, αλλά μια μη μηδενική παρατήρηση θα μπορούσε να προκύψει μόνο από την count κατανομή. Το μοντέλο Hurdle αποτελείται επίσης από δύο ξεχωριστά μέρη, ένα μέρος που περιλαμβάνει μόνο τα μηδενικά, το οποίο μοντελοποιεί τα μηδενικά στα δεδομένα, και ένα count μέρος το οποίο περιλαμβάνει και περιγράφει μόνο τις μη μηδενικές παρατηρήσεις. Οι κατανομές Zero-inflated και Hurdle μπορούν να πραγματοποιηθούν στο πλαίσιο γενικευμένων γραμμικών μοντέλων για την ενσωμάτωση επεξηγηματικών μεταβλητών, όταν αυτές είναι διαθέσιμες. Διερευνούμε τα Zero-Inflated και Hurdle μοντέλα παλινδρόμησης και εξετάζουμε την επιλογή του καλύτερου μοντέλου στο πλαίσιο πραγματικών δεδομένων. Για τις εφαρμογές που εξετάζονται, η επιλογή του τελικού μοντέλου έγινε με τη διερεύνηση της σχετικής καλής προσαρμογής των μοντέλων. Το Zero-Inflated αρνητικό διωνυμικό μοντέλο, το οποίο ήταν το καλύτερο για τα συγκεκριμένα σύνολα δεδομένων, ταιριάζει περισσότερο από το αντίστοιχο Hurdle μοντέλο, καθώς οι διαφορετικοί τύποι μηδενικών, δομικά και δειγματοληπτικά μηδενικά, λαμβάνονται υπόψη.Τεκμήριο Distance-based methods for clustering mixed type data: a review and comparison study with Gower’s coefficient(24-10-2022) Hobbs-Ismeris, Alexia-Elizabeth; Athens University of Economics and Business, Department of Statistics; Karlis, Dimitrios; Pedeli, Xanthi; Papageorgiou, IouliaΗ συσταδοποίηση αποτελεί μια δημοφιλής προσέγγιση σε εφαρμογές εξόρυξης δεδομένων από μεγάλους όγκους δεδομένων για την ανακάλυψη, διαχείριση, ανάλυση και εξαγωγή χρήσιμων πληροφοριών. Οι αλγόριθμοι συσταδοποίησης προσπαθούν να ανακαλύψουν ομοιογενείς ομάδες αντικειμένων με βάση τις τιμές των μεταβλητών. Η πλειοψηφία των αλγορίθμων συσταδοποίησης είναι κατάλληλοι είτε για αριθμητικά είτε για κατηγορικά δεδομένα, αλλά όχι για το συνδυασμό και των δύο. Τα δεδομένα που συναντώνται συνήθως στην καθημερινότητα, αποτελούνται ωστόσο απο μεικτούς τύπους δεδομένων. Μία απο τις κύριες προσεγγίσεις για τη συσταδοποίηση μεικτών δεδομένων βασίζεται στη χρήση μέτρων ομοιότητας. Επομένως, η δημιουργία κατάλληλων μέτρων ομοιότητας είναι ένα κρίσιμο βήμα για τη συσταδοποίηση αυτών των συνόλων δεδομένων. Η παρούσα διπλωματική εργασία εστιάζει σε μέτρα ομοιότητας για μεικτά δεδομένα που μπορούν να χρησιμοποιηθούν στην ιεραρχική μέθοδο συσταδοποίησης, με κύριο αντικείμενο μελέτης το μέτρο ομοιότητας του Gower. Συγκεκριμένα, εξετάζονται κάποιες τροποποιήσεις του συντελεστή Gower καθώς και πρόσθετα μέτρα ομοιότητας. Επιπρόσθετα, διεξάγεται μια μελέτη προσομοίωσης για την αξιολόγηση της απόδοσης των διαφορετικών μέτρων σε μεικτά δεδομένα, υπό διαφορετικές συνθήκες. Όλα τα εξεταζόμενα μέτρα ομοιότητας συγκρίνονται ως προς την ποιότητα των παραγόμενων συστάδων με τη χρήση του δείκτη Rand, και συνεπώς εξάγονται συμπεράσματα για την αποτελεσματικότητα των μέτρων ύπο διαφορετικές συνθήκες.Τεκμήριο How geopolitical risks affect the exchange foreign market(29-11-2022) Αμπατζιάνη, Άννα; Ampatziani, Anna; Athens University of Economics and Business, Department of Statistics; Yannacopoulos, Athanasios; Baltas, Ioannis; Kosgodagan, AlexΗ Παγκοσμιοποίηση και η διασύνδεση των παγκόσμιων αγορών έχει οδηγήσει τους επενδυτές να λαμβάνουν υπόψιν, όσο ποτέ άλλοτε, το γεωπολιτικό κίνδυνο. Οι αναταραχές και οι εντάσεις στο διεθνή χώρο μπορεί να έχουν επιπτώσεις στις χρηματαγορές, ειδικά στην αγορά συναλλάγματος. Σε αυτή την εργασία, χρησιμοποιούμε δύο διαφορετικές μεθόδους για να μετρήσουμε τη σχέση ανάμεσα στο γεωπολιτικό κίνδυνο και στις αγορές συναλλάγματος. Αρχικά, χρησιμοποιούμε ένα μη παραμετρικό Bayesian δίκτυο για να περιγράψουμε την κοινή κατανομή των γεωπολιτικών δεικτών (στρατιωτική δαπάνη, επιβολή κυρώσεων, Δείκτης Εμπορικής Αβεβαιότητας, Δείκτης Γεωπολιτικού Κινδύνου) και των αποδόσεων των ισοτιμιών συναλλάγματος για μία περίοδο 25 χρόνων. Στη συνέχεια, μοντελοποιούμε τους δείκτες κινδύνου χρησιμοποιώντας Αλυσίδες Μάκροφ και τα χρηματοοικονομικά μας δεδομένα χρησιμοποιώντας Γεωμετρική Κίνηση Brown, για να συμπεριλάβουμε στην ανάλυσή μας τον παράγοντα του χρόνου.Τεκμήριο Κυρτά μέτρα κινδύνου και επιλογή βέλτιστου χαρτοφυλακίου(24-10-2022) Κουτσουράκη, Μαρία; Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Στατιστικής; Παπαγιάννης, Γεώργιος; Μπάλτας, Ιωάννης; Γιαννακόπουλος, ΑθανάσιοςΗ διαδικασία της βελτιστοποίησης χαρτοφυλακίου είναι η δημιουργία του χαρτοφυλακίου με την μέγιστη συνολική απόδοση, είτε με την ελάχιστη συνολική ζημιά. Η επιλογή του βέλτιστου χαρτοφυλακίου γίνεται με τα ίδια κριτήρια, δηλαδή επιλέγεται το χαρτοφυλάκιο με τη μέγιστη δυνατή απόδοση, είτε με την ελάχιστη συνολική ζημιά. Ενώ υπάρχουν διάφοροι μέθοδοι και τεχνικές βελτιστοποίησης και επιλογής χαρτοφυλακίων, σκοπός της παρούσας εργασίας είναι να παρουσιάσει και να αναλύσει αυτές που χρησιμοποιούν κυρτές συναρτήσεις για την μέτρηση του κινδύνου. Συγκεκριμένα θα ασχοληθούμε με την δεσμευμένη αξία-σε-κίνδυνο (conditional value-at-risk), τα φασματικά μέτρα κινδύνου (spectral risk measures), την εντροπική αξία-σε-κίνδυνο (entropic value-at-risk) και την μέθοδο επιλογής χαρτοφυλακίου mean-expectile. Τέλος εφαρμόζονται και παρουσιάζονται οι παραπάνω μέθοδοι σε τυχαίο δείγμα με σκοπό την εύρεση του βέλτιστου χαρτοφυλακίου σε κατάλληλο λογισμικό.Τεκμήριο A simulation study on forecasting seasonal time series under mis-specification of the non-stationary seasonal roots(31-08-2022) Νικολακάκου, Σοφία-Ειρήνη; Nikolakakou, Sofia-Eirini; Athens University of Economics and Business, Department of Statistics; Vrontos, Ioannis; Pavlopoulos, Charalampos; Ioannidis, EvangelosΌταν ασχολούμαστε με τη στοχαστική εποχικότητα, ειδικά στην περίπτωση που υπάρχουν εποχιακές μοναδιαίες ρίζες, μια γνωστή κατηγορία μοντέλων χρονοσειρών που χρησιμοποιούνται για την περιγραφή τους είναι τα λεγόμενα εποχιακά μοντέλα ARIMA (SARIMA), τα οποία χρησιμοποιούνται συχνά ως βάση για προβλέψεις. Μια σημαντική υπόθεση που κάνουν αυτοί οι τύποι μοντέλων είναι η παρουσία μη στάσιμων ριζών σε όλες τις εποχιακές συχνότητες. Ωστόσο, από το έργο των Hylleberg, Engle, Granger και Yoo (1990), φαίνεται πως δεν συμβαίνει αυτό, καθώς πολλές χρονολογικές σειρές δεν έχουν αναγκαστικά εποχιακές μοναδιαίες ρίζες σε όλες τις συχνότητές τους. Ο βασικός στόχος της παρούσας διατριβής είναι να διερευνήσει τις επιπτώσεις στην προγνωστική ικανότητα των μοντέλων, όταν επιβάλλονται στα προσαρμοσμένα μοντέλα περισσότερες μη στάσιμες ή ακόμη και στάσιμες ρίζες από αυτές που υπάρχουν στη διαδικασία παραγωγής δεδομένων. Για την ανάλυση πρόβλεψης εκτός δείγματος, η σύγκριση της συμπεριφοράς των προσαρμοσμένων μοντέλων βασίζεται στο Μέσο Τετράγωνο Σφάλμα Πρόβλεψης καθώς και στη διακύμανση των σφαλμάτων πρόβλεψης. Γενικά διαπιστώνεται πως η υπόθεση και η εκτίμηση περισσότερων μη στάσιμων ριζών, από αυτές που υπάρχουν στην πραγματικότητα, μπορεί να οδηγήσει σε μεγαλύτερα σφάλματα πρόβλεψης, αντιπαραβάλλοντας επομένως την κύρια ιδέα γύρω από την οποία βασίζονται τα μοντέλα SARIMA.Τεκμήριο Στατιστικά ζητήματα που σχετίζονται με την ανάλυση δεδομένων καρκίνου του μαστού(2022) Δήμα, Ιωάννα; Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Στατιστικής; Καρλής, Δημήτριος; Πεντελή, Ξανθή; Δεμίρης, ΝικόλαοςΗ ανάλυση επιβίωσης αποτελεί στατιστική θεωρία που ασχολείται με δεδομένα διάρκειας ζωής. Στόχος της παρούσας εργασίας είναι η παρουσίαση μεθόδων της Ανάλυσης Επιβίωσης σε δεδομένα γυναικών με καρκίνο του μαστού. Αρχικά παρουσιάζεται ένα θεωρητικό υπόβαθρο για τον καρκίνο του μαστού με έμφαση στους παράγοντες που επηρεάζουν την εμφάνιση της νόσου, καθώς και ορισμένα στατιστικά στοιχεία. Ακολουθεί μια γενική θεωρητική παρουσίαση της ανάλυσης επιβίωσης όπου παρουσιάζονται μη παραμετρικες μορφές ανάλυσης όπως η μέθοδος Kaplan-Meier, ημι-παραμετρικές μορφές ανάλυσης, όπως το μοντέλο αναλογικού κινδύνου Cox και παραμετρικών μορφών ανάλυσης. Επιπλέον, γίνεται αναφορά στην χρήση υπολοίπων για τον έλεγχο διαφορετικών θεμάτων που αφορούν την καταλληλόλητα του μοντέλου του Cox, όπως και για τον έλεγχο της υπόθεσης αναλογικότητας των κινδύνων. Τέλος, παρουσιάζονται οι παραπάνω μέθοδοι Ανάλυσης Επιβίωσης σε 1310 δεδομένα γυναικών με καρκίνο του μαστού κάνοντας χρήση εργαλείων της R.