Τμήμα Στατιστικής
Μόνιμο URI για αυτήν την κοινότηταhttps://pyxida.aueb.gr/handle/123456789/12
Το Τμήμα Στατιστικής ιδρύθηκε το 1989 και είναι το πρώτο αμιγές Τμήμα Στατιστικής που δημιουργήθηκε στον ελληνικό χώρο. Σκοπός του Τμήματος είναι η προαγωγή και η μετάδοση της γνώσης μέσω της έρευνας και της διδασκαλίας στο γνωστικό πεδίο της επιστήμης της Στατιστικής και των συναφών αντικειμένων, θεωρητικών και εφαρμοσμένων, καθώς και η κατάρτιση στελεχών υψηλής στάθμης για τις ανάγκες του ιδιωτικού και του δημόσιου τομέα. Η υλοποίηση του σκοπού αυτού επιδιώκεται μέσω της ανάπτυξης της έρευνας και της εκπαίδευσης, η οργάνωση των οποίων εξασφαλίζει στους πτυχιούχους τόσο τις κατάλληλες θεωρητικές γνώσεις, όσο και την ανάπτυξη της ικανότητας εφαρμογής τους στις πραγματικές ανάγκες διαφόρων τομέων της οικονομικής δραστηριότητας (Εθνική Στατιστική Υπηρεσία της Ελλάδας, δημόσιοι και ιδιωτικοί Οργανισμοί, όπως Υπουργεία, Νοσοκομεία, Τράπεζες με υπηρεσίες Στατιστικής, Βιομηχανία, Ασφαλιστικές Εταιρείες, Εταιρείες Δημοσκοπήσεων, Ερευνητικά Κέντρα κ.λπ.). Τέλος, ο στόχος αυτός επιτυγχάνεται, επίσης, με την ανάπτυξη των διεθνών επαφών, κύρια έκφραση των οποίων είναι το Πρόγραμμα Κινητικότητας Erasmus. Η ερευνητική δραστηριότητα του Τμήματος περιλαμβάνει ένα ευρύ φάσμα θεωρητικών και εφαρμοσμένων αντικειμένων της Στατιστικής επιστήμης και των πιθανοτήτων, όπως για παράδειγμα τη Bayesian Στατιστική, την Υπολογιστική στατιστική, τις χρονοσειρές, τη βιοστατιστική, τις στοχαστικές ανελίξεις, τις εφαρμοσμένες πιθανότητες, τις επαναλαμβανόμενες μετρήσεις, τη δειγματοληψία, τη θεωρία κατανομών, την αναλογιστική στατιστική, την οικονομετρία, τα χρηματοοικονομικά, τον έλεγχο ποιότητας, τη στοχαστική ανάλυση, τις επίσημες στατιστικές. Με την απόκτηση του πτυχίου, ανοίγονται στους αποφοίτους του Τμήματος πολλές δυνατότητες σταδιοδρομίας στην ελληνική και ευρωπαϊκή βιομηχανία, σε εταιρείες συμβούλων επιχειρήσεων, στον τραπεζικό και χρηματοοικονομικό τομέα και βέβαια στη δευτεροβάθμια και επαγγελματική εκπαίδευση. Πολλοί απόφοιτοι συνεχίζουν τις σπουδές τους σε μεταπτυχιακό και διδακτορικό επίπεδο στα αντίστοιχα προγράμματα του ίδιου του Τμήματος ή άλλων Πανεπιστημίων της Ελλάδας ή του εξωτερικού.URL: http://www. stat-athens.aueb.gr
Περιήγηση
Πλοήγηση Τμήμα Στατιστικής ανά Επιβλέπων "Demiris, Nikolaos"
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Τώρα δείχνει 1 - 15 από 15
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο A Bayesian approach to the analysis of infectious disease data using continuous-time stochastic models(19-09-2023) Μπαρμπουνάκης, Πέτρος; Barmpounakis, Petros; Athens University of Economics and Business, Department of Statistics; Dellaportas, Petros; Karlis, Dimitrios; Sypsa, Vana; Kontoyannis, Ioannis; Kalogeropoulos, Kostas; Ntzoufras, Ioannis; Demiris, NikolaosΣτόχος της παρούσας διδακτορικής διατριβής είναι η ανάπτυξη στοχαστικών επιδημικών μοντέλων με έμφαση στις μολυσματικές ασθένειες σε ανθρώπους και ζώα. Αναπτύσσεται συγκεκριμένη στατιστική μεθοδολογία για να ενημερώνεικαλύτερα τις δημόσιες πολιτικές υγείας και τις επικοινωνίες που υλοποιούνται από τις κυβερνητικές οργανώσεις, ειδικά κατά τη διάρκεια κρίσεων, όπως η πανδημία του Covid-19.Τεκμήριο An analysis of the Greek 1991-2016 crime data(11/28/2018) Maggina, Spiridoula; Μαγγίνα, Σπυριδούλα; Athens University of Economics and Business, Department of Statistics; Demiris, NikolaosThe study of crimes has great scientific interest with practical implications regarding government future strategies aiming at society safety as well as and other social and macroeconomic impact.In this study, we have utilized annual historical crime data for the period 1991-2016, concerning seven common crimes in Greece's territory general,as well as focusing on the main 14 districts that form the country.The stationary time series is one of the tools for making predictions and autoregressive integrated moving average (ARIMA) models have been already successfully used in forecasting econometrics and other social science problems.The main goal of this study was the prediction of the best fitted models for depicting the crime trend and forecasting future values,regarding the whole country and Greece's 14 individual regions. In this thesis, we have used Box Jenkins ARIMA methodology for the univariate time series analysis,after we removed the trend from the series.We suggest, for the time series analysis of count data,the implementation of a method based on GLM models,performed from the R package "tscount".We examined also, a multivariate analysis with VAR models.The applied methods explain the time series adequately. According to the forecasts we do not expect significant changes in the crime pattern in the future. Regarding the variable “fraud” however, a substancial increase is been expected for the next 30 years in total Greece and some specific regions namely An.Makedonia-Thraki, Thessalia, Ipeiros, Peloponnisos, Attiki, Ionia Nisia, Voreio and Notio Aigaio according to the predictive models. ARIMA models could perform better in shorter run forecasts and with no doubt longer time series could provide better results.Τεκμήριο Bayesian evidence synthesis for the analysis of biomedical data(31-05-2024) Αψεμίδης, Αναστάσιος; Apsemidis, Anastasios; Athens University of Economics and Business, Department of Statistics; Vasdekis, Vassilis; Kalogeropoulos, Kostas; Ntzoufras, Ioannis; Karlis, Dimitrios; Kyriakidis, Epaminondas; Kypraios, Theodore; Demiris, NikolaosΣτην εποχή άνθησης της Στατιστικής και της Επιστήμης των Δεδομένων, η ανάλυση βιοϊατρικών δεδομένων κερδίζει συνεχώς την προσοχή ερευνητών και επαγγελματιών, οι οποίοι προσπαθούν να χρησιμοποιήσουν την πληθώρα πληροφορίας σε διαδικασίες λήψης αποφάσεων. Η Μπεϋζιανή μεθοδολογία, της οποίας η δημοτικότητα έχει επίσης αυξηθεί τις τελευταίες δεκαετίες λόγω της υπολογιστικής και στατιστικής προόδου σε μεθόδους προσομοίωσης Μόντε Κάρλο, παρέχει ένα συνεκτικό πλαίσιο σύνθεσης πληροφορίας από διαφορετικές πηγές. Έτσι, στοχεύουμε στη χρήση Μπεϋζιανών μοντέλων, για να εκτιμήσουμε σημαντικές ποσότητες στα πεδία τόσο των λοιμωδών όσο και των μη λοιμωδών ασθενειών. Όσον αφορά τις λοιμώδεις ασθένειες, ασχολούμαστε με την πανδημία Covid-19 και, συγκεκριμένα, κατασκευάζουμε στοχαστικά διαμερισματικά μοντέλα διακριτού χρόνου βασισμένα στο λανθάνον επίπεδο των καταγεγραμμένων και μη κρουσμάτων, ώστε να εκτιμήσουμε τo ρυθμό αναπαραγωγής και το ποσοστό των παρατηρούμενων κρουσμάτων. Επίσης, αντιμετωπίζουμε το πρόβλημα υπό το πρίσμα των δυναμικών συστημάτων με στόχο την ανάπτυξη διορατικότητας, αλλά και την κατασκευή ποσοτήτων κατάλληλων για υποστήριξη λήψης αποφάσεων. Στο πλαίσιο των μη λοιμωδών ασθενειών, προτείνουμε μεθόδους παρεκβολής της καμπύλης επιβίωσης, λαμβάνοντας υπόψη προβολές της θνησιμότητας, με στόχο να εκτιμήσουμε τα χρόνια ζωής που κερδίζονται, όταν εφαρμόζεται μία θεραπεία αντί κάποιας άλλης. Η μεθοδολογία παρουσιάζεται μέσα από τρία παραδείγματα που απασχολούν την ιατρική κοινότητα και αφορούν τον καρκίνο του μαστού, το μεταστατικό μελάνωμα και την καρδιακή αρρυθμία.Τεκμήριο The bilateral migration flows in Greece(03/01/2018) Ρήγκου, Αμυγδαλιά; Athens University of Economics and Business, Department of Statistics; Demiris, NikolaosThe aim of this diploma thesis is to study the trend in the inflow and outflow of migrants in Greece for the years 1991-2016, the causes and the effects on the change in the population distribution as well as the possibility of anticipating the future migration flow.Τεκμήριο Breast cancer classification via statistical learning techniques, with applications to the Wisconsin diagnostic data set(09/28/2021) Pardali, Sofia; Παρδάλη, Σοφία; Athens University of Economics and Business, Department of Statistics; Demiris, NikolaosBreast cancer is one of the most reported types of cancer around the world and the third leading cause of death among women. The high mortality rate due to breast cancer can be best tackled via early detection so that prevention can be done in a timely and efficient manner. Several statistical-based approaches have been developed to support medical decision makers in early breast cancer detection. Various techniques may provide different desired accuracies and it is therefore vital to use the method which provides the best results. This thesis is concerned with a comparative analysis of a number of statistical learning methods, namely Random Forests, KNN algorithm, Logistic Regression and Lasso Regression. These techniques are applied to the Wisconsin breast cancer classification problem. All the above algorithms were implemented in the R programming language.Τεκμήριο Computer intensive methods for statistical models with latent structuresGerontogianni, Stavroula; Γεροντογιάννη, Σταυρούλα Δ.; Athens University of Economics and Business, Department of Statistics; Demiris, NikolaosSeveral methods have been proposed and applied to different data problems in order to makeBayesian inference for the unknown density of the parameters in interest. The most widelyused so far are the Markov Chain Monte Carlo methods, including Gibbs Sampling which willbe one of the algorithms in focus on this project. Moreover, contemporary methods such asVariational Inference and Hamiltonian Monte Carlo promise respectable results as regardsaccuracy and time speed. On account of this, they are considered to be quite useful alternativesin cases where their advantages tend to play a greater role than their disadvantages. In thisproject the three methods mentioned above, giving greater emphasis on the theory behindVariational Inference, are implemented in mixture models of Gaussians aiming at theircomparison, in terms of accuracy, statistical efficiency and computational cost. At this point,it is of crucial importance to highlight the different softwares used to implement the algorithms;Gibbs sampling run through OpenBugs and Variational Inference as well as HamiltonianMonte Carlo through the new probabilistic language Stan. Consequently, any differencesoccurring in the results may also be derivatives of the different softwares usage. At this stage,it is important to mention that Stan is on experimental level, especially for the VariationalInference algorithm; hence some inaccuracies in the results may occur. Nevertheless, it isinteresting to test its capabilities and the way it works, since it could be a quite useful tool soon.The interface for both softwares is chosen to be R; hence the R code is provided in theAppendix. It must be also noted that Stan provides a black box procedure for theaforementioned algorithms, which is discussed in detail for each method.Τεκμήριο Extrapolating survival curves with applications in health economics(15-09-2023) Γαλανάκης, Μιχάλης; Galanakis, Michalis; Athens University of Economics and Business, Department of Statistics; Pedeli, Xanthi; Bakoyannis, Georgios; Demiris, NikolaosΗ προβολή καμπυλών επιβίωσης μπορεί να είναι δυνητικά επικίνδυνη, εφόσον δεν μπορεί κανείς να κάνει τέτοιες προβλέψεις με προκαθορισμένη στατιστική ακρίβεια. Ωστόσο, αυτή η προβολή των καμπυλών επιβίωσης λαμβάνει αναπόφευκτα χώρα σε πλήθος επιστημονικών πεδίων, συμπεριλαμβανομένων των οικονομικών εκτιμήσεων στον τομέα της υγείας. Στο πλαίσιο της μελέτης αποδοτικότητας κόστους, οι προβολές καμπυλών επιβίωσης διαδραματίζουν κρίσιμο ρόλο, καθώς ποσοτικοποιούν το κέρδος στη διάρκεια ζωής που σχετίζεται με μια νέα επέμβαση. Αυτός ο παράγοντας είναι ιδιαίτερα σημαντικός λόγω της περιορισμένης διάρκειας των τυχαιοποιημένων κλινικών δοκιμών, οι οποίες απαιτούν προβλέψεις σχετικά με την επιβίωση, πέρα από την περίοδο παρακολούθησης των ασθενών. Το κύριο αντικείμενο αυτής της διατριβής είναι να εκτιμήσει με ακρίβεια τον μέσο χρόνο επιβίωσης, ένα σημαντικό μέτρο που παρέχει ενδείξεις για την αποτελεσματικότητα μιας θεραπείας σε σχέση με το πόσο παρατείνει τον χρόνο ζωής. Η διατριβή αρχίζει με μια ανασκόπηση των υπαρχόντων παραμετρικών μοντέλων που συνήθως χρησιμοποιούνται για την προβολή των καμπυλών επιβίωσης, συμπεριλαμβανομένων των μοντέλων Exponential, Weibull, Log-Normal, Log-Logistic και Gompertz. Τα παραπάνω παραμετρικά μοντέλα εξετάζονται ενώ δίνεται ιδιαίτερη έμφαση στη σημασία επιλογής κατάλληλων κριτηρίων και μέτρων σχετικών με την προβλεπτική ικανότητα τους, προκειμένου να χρησιμοποιηθεί το πιο αξιόπιστο μοντέλο για την πρόβλεψη. Το κεντρικό ενδιαφέρον εστιάζεται στην ανάπτυξη ανθεκτικών μεθοδολογιών, οι οποίες επιτρέπουν να γίνονται όσο το δυνατόν πιο αξιόπιστες μακροπρόθεσμες προβολές των καμπυλών επιβίωσης. Έτσι, ενισχύονται οι πληροφορίες που αξιοποιούνται για την λήψη αποφάσεων στον τομέα της υγείας, καθώς και για την διάθεση των υπάρχοντών πόρων. Η πρακτική εφαρμογή των προτεινόμενων μεθοδολογιών παρουσιάζεται μέσω μιας μελέτης που χρησιμοποιεί πραγματικά κλινικά δεδομένα με την ονομασία METABRIC, τα οποία σχετίζονται με τον καρκίνο του μαστού. Η απόδοση του κάθε μοντέλου αξιολογείται σχολαστικά μέσα από τη σύγκριση των αποτελεσμάτων της εκάστοτε πρόβλεψης με τα παρατηρούμενα εμπειρικά αποτελέσματα, τα οποία αποκτώνται μέσω της χρήσης κλασικών μη παραμετρικών μεθόδων. Τα αποτελέσματα αναδεικνύουν τη χρησιμότητα επιλογής κατάλληλων μοντέλων σε διαφορετικές χρονικές στιγμές, καθώς διαφορετικά μοντέλα μπορεί να εμφανίζουν υψηλότερη προβλεπτική ικανότητα σε συγκεκριμένες χρονικές περιόδους. Επιπλέον, η διατριβή αυτή παρέχει πληροφορίες σχετικά με την εγκυρότητα που έχουν οι προβολές των καμπυλών επιβίωσης, αξιοποιώντας μέτρα αξιολόγησης όπως η Λ1, η Λ2 νόρμα και το μέσο τετραγωνικό σφάλμα. Μέσω των παραπάνω, επιτυγχάνεται η σύγκριση μεταξύ των παρατηρούμενων και των προβλεπόμενων τιμών των καμπυλών επιβίωσης. Επιπρόσθετα, μια πιο σχολαστική στρατηγική θα περιλάμβανε την αξιολόγηση διαφορετικών μοντέλων προκειμένου να γίνουν οι προβλέψεις, ανάλογα με το που φτάνει η καμπύλη επιβίωσης σε διαφορετικούς χρονικούς ορίζοντες. Ακόμα, είναι γεγονός ότι η ακριβής μακροπρόθεσμη πρόβλεψη εξαρτάται σε μεγάλο βαθμό από τη διαθεσιμότητα μακροπρόθεσμων δεδομένων. Τέλος, είναι αξιοσημείωτο ότι προκειμένου να επιτευχθεί αξιόπιστη εκτίμηση των προβολών των καμπυλών επιβίωσης, θα πρέπει να αξιοποιηθούν εξωτερικές πηγές δεδομένων ή/και γνώμες ειδημόνων.Τεκμήριο The infection fatality rate and SARS-CoV-2 transmission(07/08/2021) Zanni, Maria A.; Ζαννή, Μαρία Α.; Athens University of Economics and Business, Department of Statistics; Vasdekis, Vassilis; Kyriakidis, Epaminondas; Demiris, NikolaosDetermining the age-dependent infection fatality rate (IFR) for SARS-CoV-2 the virus that causes COVID-19 is a topical issue. The infection fatality rate is defined as the number of deaths over the total number of infections. This is in contrast to the case fatality rate (CFR), the ratio of deaths over reported cases, so the denominator of the IFR included the unreported cases. Here we summarise the results of 12 studies that met specific criteria for the assessment of the IFR. A Bayesian meta-regression procedure using STAN and R was used to estimate IFR, a strongly age-dependent quantity. The COVID-19 IFR grows exponentially with age and our results for specific age grouping suggest that it is quite small 0.004% for the age group 0-17 and relatively small at 0.037% for the age group 18-39. A significant increase is observed in the ages between 40-64 where the IFR is 0.469% and it jumps to 4.326% for age group 65+. The total, age-dependent infection fatality rates are calculated for the 3 waves of the COVID-19 pandemic in Greece using the age distribution of the observed cases reported in Greece from March, 2020 to April, 2021. Finally, using these estimates of the infection fatality rates, the transmission of infection and total disease burden for Greece was estimated through an appropriate epidemic model.Τεκμήριο Influenza rates among different age groups in the federal states of Germany - a statistical analysis(2018) Zioga, Dimitra; Ζιώγα, Δήμητρα; Athens University of Economics and Business, Department of Statistics; Demiris, NikolaosThis thesis follows the influenza surveillance data and analysis of the German federation from 2001-2015 for understanding the patterns exhibited in each German federal state. The statistical analysis defines patterns per age group as it was expected, as well as per state. This surveillance platform follows influenza pandemic events during these years and this affect seasonal epidemic statistics. The analysis is 2-fold (exploratory analysis and model-based inference) employing conventional statistics as well as Zero Inflated Model (ZIP) and Autoregressive Conditional Poisson (ACP) models. Many of the theories related with the transmissibility between human and avian species, observation of upward trends after a pandemic and the age group specific characteristics that may be related with incomplete vaccination appear throughout this analysis. In conclusion, this valuable methodology can correlate demographic and population elements, with the actual biology of the infection and provide a roadmap for influenza surveillance and prevention.Τεκμήριο Non-parametric estimation of optimal individualized treatment rules for survival data(06-09-2024) Ehrlich, Andre; Athens University of Economics and Business, Department of Statistics; Bakoyannis, Georgios; Pedeli, Xanthi; Demiris, NikolaosΗ Ιατρική Ακριβείας στοχεύει στην παροχή εξατομικευμένης φροντίδας πέρα από τους κανόνες θεραπείας «ένα μέγεθος για όλους», λαμβάνοντας υπόψη την ετερογένεια στην επίδραση της θεραπείας. Η εξατομίκευση της θεραπείας, δηλαδή ο εντοπισμός υποομάδων ασθενών για να λάβουν διακριτές θεραπευτικές επιλογές, μπορεί να ωφελήσει τους ασθενείς με δύο τρόπους: (i) να επεκτείνει την επιβίωση πληθυσμών (ii) να απαλλάξει τους ασθενείς από επιθετική θεραπεία που είναι απίθανο να ωφεληθούν. Οι μέθοδοι Μάθησης Σταθμισμένης Έκβασης (Outcome Weighted Learning - OWL) επιλύουν άμεσα την εκτίμηση κανόνων θεραπείας χρησιμοποιώντας Ελαχιστοποίηση Εμπειρικού Κινδύνου, αποφεύγοντας έτσι αυστηρές υποθέσεις μοντέλου και ελαχιστοποιώντας την πιθανότητα εσφαλμένης προδιαγραφής μοντέλου. Εξετάζουμε τις κύριες ιδέες στη βιβλιογραφία της εκτίμησης βέλτιστων Εξατομικευμένων Κανόνων Θεραπείας, με έμφαση στις μεθόδους που χειρίζονται εκβάσεις επιβίωσης. Η Πολυκαταστασιακή Μάθηση Σταθμισμένης Έκβασης (Multistate Outcome Weighted Learning - MSOWL) παράγει βέλτιστα αποδοτικές εκτιμήσεις ολοκληρώνοντας τις ατομικές στοχαστικές διαδικασίες, συμπεριλαμβανομένων των περιπτώσεων που διακόπτεται η παρατήρηση – αν και αυτή η στατιστική αποδοτικότητα έρχεται με το κόστος κυβικής υπολογιστικής πολυπλοκότητας, την οποία βελτιώνουμε μέσω διαίρεσης και κατάκτησης. Αξιολογούμε το κέρδος αποδοτικότητας και την κατανομική ευρωστία της μεθόδου MSOWL έναντι άλλων μεθόδων OWL & ITR. Αξιολογούμε εκτιμητές ITR συμπεριλαμβανομένων των μεθόδων OWL, ενός εκτιμητή Παλινδρόμησης Έκβασης Cox, και των τυπικών κανόνων θεραπείας «ένα μέγεθος για όλους». Αξιολογούμε ένα νέο σύνολο δεδομένων από μια ογκολογική κλινική δοκιμή, η οποία εκτιμά την προσθήκη ανοσοθεραπείας στην τυπική χημειοθεραπεία είτε για Καρκίνο του Παγκρέατος.Τεκμήριο Population-matching to historical, single, and pooled studies of varying designsΜπαρούμα, Ιφιγένεια; Barouma, Ifigeneia; Athens University of Economics and Business, Department of Statistics; Karlis, Dimitrios; Ntzoufras, Ioannis; Demiris, NikolaosΗ λήψη αποφάσεων σχετικά με την αξιολόγηση της τεχνολογίας στον τομέα της υγείας συχνά καθοδηγείται από τις κατάλληλες μεθοδολογίες της στατιστικής. Πριν ένα νέο προϊόν διατεθεί στην αγορά, η συγκριτική έρευνα αποτελεσματικότητας είναι υψίστης σημασίας για τους οργανισμούς αξιολόγησης τεχνολογιών υγείας.Η μεθοδολογία της έμμεσης σύγκρισης θεραπειών μέσω πληθυσμιακής αντιστοίχισης (MAIC) επιχειρεί να μειώσει τη μεροληψία αντιστοιχίζοντας τα δεδομένα σε επίπεδο ασθενών από την κλινική δοκιμή (στην οποία οι ασθενείς έχουν δεχθεί τη θεραπεία ενδιαφέροντος) με τα συγκεντρωτικά δεδομένα για τις συγκριτικές κλινικές δοκιμές όπως αυτά αντλούνται από τη βιβλιογραφία. Πολύ συχνά, θεραπείες με κοινό μηχανισμό δράσης μπορούν να κατηγοριοποιηθούν ως ομάδα θεραπειών. Τι συμβαίνει, λοιπόν, σε περιπτώσεις όπου το ενδιαφέρον στρέφεται στην απόκτηση της σχετικής αποτελεσματικότητας της θεραπείας ενδιαφέροντος έναντι μίας ολόκληρης ομάδας φαρμάκων που χαρακτηρίζονται από κοινό τρόπο δράσης. Μέσω τεχνικών μέτα ανάλυσης, οι μελέτες οι οποίες εκπροσωπούν τις μεμονωμένες θεραπείες, μπορούν να συντεθούν έτσι ώστε να γίνει αναπαράσταση της ομάδας θεραπειών. Οι τεχνικές αυτές καθώς και η διάσταση στην οποία ορίζονται (μονομεταβλητή, πολυμεταβλητή) ποικίλλουν αναλόγως το είδος της έκβασης ενδιαφέροντος καθώς και της διαθεσιμότητας των δεδομένων.Ο στόχος της παρούσας διατριβής είναι να παρουσιαστεί η μεθοδολογία της προσαρμοσμένης έμμεσης σύγκρισης που συγκρίνει τη θεραπεία ενδιαφέροντος με θεραπείες που αναδείχθηκαν από τη βιβλιογραφία είτε σε μεμονωμένες είτε σε συγκεντρωτικές μελέτες. Θα παρουσιαστεί μια μελέτη περίπτωσης όπου θα εφαρμοστούν οι προαναφερθείσες τεχνικές χρησιμοποιώντας ένα προσομοιωμένο σύνολο δεδομένων που περιλαμβάνει δεδομένα δοκιμών για να προκύψει η σχετική αποτελεσματικότητα της λαμβανόμενης θεραπείας έναντι των υφιστάμενων θεραπειών σε έναν σπάνιο τύπο καρκίνου του λεμφικού συστήματος.Τεκμήριο Potential impact of data maturity on survival outcomes and cost-effectiveness with application to cancer studies(20-03-2024) Τακτικού, Αναστασία; Taktikou, Anastasia; Athens University of Economics and Business, Department of Statistics; Karlis, Dimitrios; Ntzoufras, Ioannis; Demiris, NikolaosΗ ανάλυση κόστους αποδοτικότητας αποτελεί έναν από τους κύριους πυλώνες της αξιολόγησης τεχνολογιών υγείας (ΑΤΥ) και έχει καθιερωθεί ως απαραίτητη προϋπόθεση για την δημοσίευση κατευθυντήριων οδηγιών από αρκετούς οργανισμούς υγείας. Μια σημαντική πηγή διακύμανσης μεταξύ των κλινικών μελετών σχετίζεται με τη διάρκεια της παρακολούθησης και την ωριμότητα των δεδομένων. Στόχος της παρούσας διατριβής είναι να διερευνήσει την επίδραση της ωριμότητας των δεδομένων στην εκτίμηση των αποτελεσμάτων επιβίωσης και κόστους-αποτελεσματικότητας εξετάζοντας δεδομένα από ασθενείς που υποβάλλονται σε θεραπεία δεύτερης γραμμής για μη μικροκυτταρικό καρκίνο του πνεύμονα. Πραγματοποιήθηκε βιβλιογραφική ανασκόπηση για τον εντοπισμό κλινικών δοκιμών φάσης 3, δύο βραχιόνων, στις οποίες συμμετείχαν ασθενείς που έλαβαν θεραπεία δεύτερης γραμμής για μη μικροκυτταρικό καρκίνο του πνεύμονα και οι οποίες ανέφεραν αποτελέσματα για τουλάχιστον δύο περιόδους παρακολούθησης. Μέσω της βιβλιογραφικής ανασκόπησης εντοπίστηκαν τέσσερις μελέτες που πληρούσαν τα παραπάνω κριτήρια. Τα δεδομένα από τις δύο περιόδους παρακολούθησης χρησιμοποιήθηκαν σε ένα μοντέλο κόστους-αποτελεσματικότητας κατανεμημένης επιβίωσης, το οποίο χρησιμοποιείται ευρέως στην ογκολογία. Οι εισακτέες τιμές για το μοντέλο κατανεμημένης επιβίωσης απαιτούν την παρεκβολή των δεδομένων συνολικής επιβίωσης και επιβίωσης χωρίς εξέλιξη. Ως εκ τούτου, η σύγκριση των αποτελεσμάτων με δεδομένα από τις δυο διαφορετικές περιόδους παρακολούθησης πραγματοποιήθηκε σε δύο επίπεδα. Αρχικά, εξετάσαμε πώς η ωριμότητα των δεδομένων επηρέασε τις εκτιμήσεις της μέσης συνολικής επιβίωσης και της μέσης επιβίωσης χωρίς εξέλιξη, τις μακροπρόθεσμες παρεμβολές και ποια μοντέλα επιβίωσης ήταν καταλληλότερα με βάση την ωριμότητα των δεδομένων. Στη συνέχεια, αξιολογήσαμε πώς αυτές οι αλλαγές στα αποτελέσματα επιβίωσης μεταξύ των περιόδων παρακολούθησης και των διαφορετικών μοντέλων εντός του ίδιου χρονικού ορίζοντα, επηρέασαν τις εκτιμήσεις κόστους-αποτελεσματικότητας, όπως τον λόγο αυξημένου κόστους-αποτελεσματικότητας (ICER) και τους σχετικούς εκτιμητές που αφορούν την λήψη αποφάσεων.Η πλειονότητα των ευρημάτων που σχετίζονται με τα αποτελέσματα της επιβίωσης δεν κατάφεραν να καταδείξουν ένα συνεπές μοτίβο που θα μπορούσε να εφαρμοστεί καθολικά για τη συγκεκριμένη εφαρμογή. Η μέση συνολική επιβίωση και η επιβίωση χωρίς εξέλιξη αυξήθηκαν ως επί το πλείστων χρησιμοποιώντας δεδομένα από τη δεύτερη περίοδο παρακολούθησης, αλλά υπάρχουν εξαιρέσεις που δεν αφήνουν περιθώρια γενίκευσης. Παρόλα αυτά, σε όλες τις κλινικές μελέτες και υπό διαφορετικές συνθήκες το} ICER, αυξήθηκε χρησιμοποιώντας τα πιο ώριμα δεδομένα, η υπόθεση αυτή όμως χρήζει περαιτέρω διερεύνησης.Τεκμήριο Probabilistic forecast determination(2021) Nikologiannis, Christos; Νικολογιάννης, Χρήστος; Athens University of Economics and Business, Department of Statistics; Papastamoulis, Panagiotis; Karlis, Dimitrios; Demiris, NikolaosProbabilistic forecasts have gained significant ground nowadays compared to point forecasts due to the additional information they provide. In point forecasts, the main metric for evaluation is the accuracy of our model's point predictions. The goal of this work is to theoretically discuss probabilistic forecasts and present ways to evaluate their performance and statistical consistency. After an almost philosophical discussion on calibration and sharpness principles, which has been an old topic of research, a theoretical framework for scoring rules is presented with reference to a compilation of other works from the literature on the subject. The competing methods employed are logistic regression, with its regularized version versus tree-based methods, including Desicion trees, Random forests and Reinforcement learning trees. To highlight the add-on value of the scoring rules, hands-on applications of those scoring rules are conducted in binary classification problems to compare probabilistic forecasts evaluated upon simulated and real data in various dimensionality settings.Τεκμήριο Sentiment analysis and prediction using Twiitter data(10/27/2018) Καμπουρίδης,Νικόλαος; Kabouridis, Nikolaos; Demiris, NikolaosIn this thesis we examine the role of twitter from the politicians as well as thecitizen’s perspective. Specifically, we study its influence and contribution in the political process. The main objective of this thesis is to analyze the data relating tothe elections and the referendum that took place in Greece during 2015.Τεκμήριο Shrinkage estimators and the design of basket trials(27-09-2023) Στρουμπάκου, Φωτεινή; Stroumpakou, Foteini; Athens University of Economics and Business, Department of Statistics; Ntzoufras, Ioannis; Vasdekis, Vassilis; Demiris, NikolaosΗ παρούσα διπλωματική εξετάζει την διαρκή πρόκληση που θέτει ο καρκίνος και διερευνά μια καινοτόμα προσέγγιση πάνω στο θέμα , αυτή των δοκιμών καλαθιού. Οι δοκιμές καλαθιού προσφέρουν τεράστια κέρδη αποδοτικότητας πάνω στην έρευνα του καρκίνου, συμπεριλαμβάνοντας άτομα με διάφορους τύπους καρκίνου και κοινές γενετικές μεταλλάξεις σε μία κοινή κλινική δοκιμή. Στατιστικά, αυτό μεταφράζεται στην ταυτόχρονη εκτίμηση πολλών στόχων. Ο Εκτιμητής Μέγιστης Πιθανοφάνειας (ΕΜΠ) δεν είναι ο βέλτιστος σε σενάρια που αφορούν την εκτίμηση τριών ή περισσότερων παραμέτρων και παραλλαγές του εκτιμητή James-Stein μπορεί να είναι ανώτερες όσον αφορά την ελαχιστοποίηση του Μέσου Τετραγωνικού Σφάλματος. Οι σύγχρονες δοκιμές καλαθιού έχουν συνήθως μεταβλητή απόκρισης είτε δίτιμη είτε σχετική με την ανάλυση επιβίωσης, και σε αυτές εξετάζονται διάφορα μοντέλα συμπεριλαμβανομένων των ανεξάρτητων μοντέλων, των μπεϋζιανών ιεραρχικών μοντέλων και του μοντέλου EXNEX το οποίο αφορά μια μείξη των άλλων δύο μοντέλων. Διεξάγουμε αρκετά πειράματα προσομοιώσεων καθώς και αναλύσεις σε πραγματικά δεδομένα τα οποία αποκαλύπτουν συγκεκριμένα μοτίβα, επιβεβαιώνοντας σε μεγάλο βαθμό τη θεωρία. Ειδικότερα, το ανεξάρτητο μοντέλο εμφανίζει χαμηλότερες τιμές μεροληψίας, αλλά υψηλή διακύμανση, ενώ τα μπεϋζιανά ιεραρχικά μοντέλα εμφανίζουν υψηλότερη μεροληψία αλλά χαμηλότερη διακύμανση και συνολικό μέσο τετραγωνικό σφάλμα. Συμπερασματικά, αυτή η διατριβή αναδεικνύει το ρόλο των αποδοτικών στατιστικά μεθόδων στις δοκιμές καλαθιού, αντιμετωπίζοντας κατάλληλα την ετερογένεια που προκύπτει από τους διάφορους τύπους καρκίνου και επηρεάζει τον βέλτιστο παράγοντα συρρίκνωσης.