Abstract : | Η ανίχνευση ακραίων τιμών σε ένα πολυμεταβλητό και χωρίς επίβλεψη περιβάλλον είναι ένα σημαντικό πρόβλημα στη στατιστική ανάλυση. Με το πέρασμα των χρόνων, πολλές στατιστικές μέθοδοι εξετάζονται και εφαρμόζονται, αλλά μόνο μερικές οδηγούν στον ακριβή εντοπισμό των πιθανών ακραίων τιμών (στην περίπτωση μικρού επιπέδου μόλυνσης).Σε αυτό το πλαίσιο, η μέθοδος Invariant Coordinate Selection (ICS) εμφανίζει αξιοσημείωτες ιδιότητες για τον εντοπισμό ακραίων συντελεστών. Συγκρίνοντάς την και με άλλες προσεγγίσεις, φαίνεται ότι η ICS είναι εξίσου αποτελεσματική και πλεονεκτεί των άλλων μεθόδων όταν έχουμε μικρά ποσοστά ακραίων τιμών που βρίσκονται σε υποχώρους χαμηλών διαστάσεων.Ο στόχος αυτής της μεταπτυχιακής διατριβής είναι να διερευνήσει τα (ασυμπτωτικά) χαρακτηριστικά των λειτουργιών ενός Invariant Coordinate συστήματος και να εισαγάγει νέες προσεγγίσεις για την ανεξάρτητη ανάλυση των components. Detecting outliers in a multivariate and unsupervised context is an important and ongoing problem in statistical analysis. Through the years, many statistical methods are surveyed and implemented in R, but only a few lead to the accurate identification of potential outliers in the case of a small level of contamination. In this particular context, the Invariant Coordinate Selection (ICS) method shows remarkable properties for identifying outliers that lie on a low-dimensional subspace in its first invariant components. Comparing with several other approaches, it appears that ICS is generally as efficient as its competitors and shows an advantage in the context of a small proportion of outliers lying in a low-dimensional subspace. The aim of this master thesis is to explore (asymptotical) characteristics of Invariant Coordinate System functionals and to introduce new approaches for independent component analysis.
|
---|