Abstract : | Η παρούσα πτυχιακή εργασία παρουσιάζει το πρόβλημα του υψηλού αριθμού διαστάσεων σε συλλογές δεδομένων και πως αυτό μπορεί να αντιμετωπιστεί με την εφαρμογή διαφόρων μεθόδων μείωσης διαστάσεων. Παρουσιάζει τις παρούσες μεθοδολογίες, που σχετίζονται με το εν λόγω ζήτημα, μέσω μαθηματικών αποδείξεων και αναλυτικών επεξηγήσεων και περιγραφών. Επίσης, εστιάζει στη Μπεϋζιανή μεθοδολογία ανάλυσης δεδομένων και το πως συνδυαζόμενη με τη μέθοδο των τυχαίων προβολών, ως κύρια μέθοδο μείωσης διαστάσεων, μπορεί να παρέχει έγκυρα και συνεπή αποτελέσματα για συλλογές δεδομένων μεγάλης κλίμακας που απαιτούν πολλούς υπολογιστικούς και χρονικούς πόρους για τη διενέργεια στατιστικής ανάλυσης. The current thesis presents the problem of the high dimensional datasets and how can this be tackled with the application of various dimensionalityreduction techniques. It presents, the current approaches andmethodologies, related to that matter, through mathematical proofs andintuitive explanation - description. Also, it emphasizes in the Bayesianstatistical analysis framework and how it can be combined with randomprojection, as dimensionality reduction technique, in order to provide reasonableand intuitive inference for large scale data that demand greatcomputational and time sources.
|
---|