Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Οικονομικών Επιστημών / School of Economics Τμήμα Οικονομικής Επιστήμης / Department of Economics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Βελτίωση της ακρίβειας πρόβλεψης μέσω της ομαδοποίησης συναφών χρονοσειρών και της εξαγωγής γνώσης από ιεραρχικά δεδομένα

Εναλλακτικός τίτλος :	Improving forecast accuracy by clustering related time series and extracting knowledge from hierarchical data

Δημιουργός :	Λύτρας, Γεώργιος

Συντελεστής :	Σπηλιώτης, Ευάγγελος (Επιβλέπων καθηγητής) Βρόντος, Ιωάννης (Εξεταστής) Τζαβαλής, Ηλίας (Εξεταστής) Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Οικονομικής Επιστήμης (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	122σ.

Γλώσσα :	en

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9347

Περίληψη :	Στον τομέα της οικονομικής επιστήμης και κατ’ επέκταση της επιχειρήσεις, υπάρχουν εφαρμογές που απαιτούν προβλέψεις οι οποίες αφαιρούν χρονοσειρές. Οι εν λόγω χρονοσειρές, τυχαίνει της φορές να είναι ιεραρχικά δομημένες, έχοντας ως βάση οργάνωσης κριτήρια που αφορούν τον τύπο του προϊόντος και την γεωγραφία. Λόγω των περιορισμών συγκέντρωσης (aggregation constrains) που παρουσιάζουν οι συγκεκριμένες χρονοσειρές, έχει δημιουργηθεί η ανάγκη για την παραγωγή “συμφιλιωμένων” προβλέψεων (reconciled forecasts) σε ολόκληρη την ιεραρχία. Δηλαδή, επιχειρείται να διασφαλισθεί ότι οι προβλέψεις, αθροίζονται καταλλήλως κατά μήκος όλων των επιπέδων της ιεραρχικής δομής.Υπάρχουν της διαφορετικές προσεγγίσεις όσον αφορά την επίτευξη “συμφιλιωμένων” προβλέψεων (reconciled forecasts), καθώς και την διασφάλιση της συνοχής κατά μήκος των διαφορετικών επιπέδων της ιεραρχίας. Συγκεκριμένα, δυο από αυτές της προσεγγίσεις αποτελούν και της πιο ευρέως διαδεδομένες. Η πρώτη ονομάζεται “top-down” ενώ η δεύτερη “bottom-up”, και υπάρχει σε περισσότερες από μια παραλλαγές. Και της δύο προσεγγίσεις, σε πρώτο στάδιο οι προβλέψεις παράγονται σε ένα συγκεκριμένο επίπεδο συγκέντρωσης (aggregation level) το οποίο αποτελεί είτε το υψηλότερο επίπεδο (top-down approach) είτε το χαμηλότερο (bottom-up approach) αντιστοίχως. Έπειτα, οι προαναφερθείσες προβλέψεις είτε αθροίζονται (aggregated) για τα υψηλότερα επίπεδα, είτε διαιρούνται (disaggregated) για τα χαμηλότερα επίπεδα. Η προαναφερθείσα διαδικασία έχει ως αποτέλεσμα την παραγωγή συνεπών προβλέψεων για τα υπόλοιπα επίπεδα της ιεραρχίας. Εκτός από της προηγούμενες προσεγγίσεις, κατά την πειραματική διαδικασία της συγκεκριμένης διατριβής, χρησιμοποιήθηκε της και η “optimal forecast combination”. Η εν λόγω προσέγγιση χρησιμοποιεί της προβλέψεις που παράγονται για το πλήρες σύνολο της ιεραρχίας. Ακριβέστερα, ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα των συνολικών προβλέψεων (aggregate forecasts) κατά μήκος της της ιεραρχικής δομής. Ενώ παράλληλα εκπληρώνεται και η υπόθεση της αμεροληψίας.Δεδομένου ότι η “optimal forecast combination” βασίζεται σε πολλαπλές προβλέψεις και εκμεταλλεύεται πληροφορίες από πολλαπλά επίπεδα συγκέντρωσης (aggregation levels), συνήθως έχει ως αποτέλεσμα την παραγωγή προβλέψεων υψηλής ακρίβειας. Στην εν λόγω διατριβή τίθεται το ερώτημα σχετικά με το αν η ακρίβεια των μεθόδων συμφιλίωσης μπορεί να παρουσιάσει περαιτέρω βελτίωση, δεδομένης της δημιουργίας πιο ομοιογενών ιεραρχιών, που αποτελούνται από σειρές οι οποίες διαθέτουν παρόμοια μοτίβα και χαρακτηριστικά. Προκειμένου να διερευνηθεί το παρόν ζητούμενο, αρχικά χρησιμοποιήθηκαν μέθοδοι clustering, έτσι ώστε να πραγματοποιηθεί η ομαδοποίηση των κατώτερων σειρών της αρχικής ιεραρχίας σε ομοιογενείς συστάδες. Εν συνεχεία, οι συστάδες χρησιμοποιούνται για την δημιουργία νέων ιεραρχιών βελτιωμένης ομοιογένειας, με σκοπό την παροχή περαιτέρω συνεκτικών προβλέψεων.Τέλος, προκειμένου να αξιολογηθεί η προτεινόμενη προσέγγιση του παραπάνω ερευνητικού ζητουμένου, έγινε η χρήση της συνόλου δεδομένων το οποίο προέρχεται από τον τομέα της ενέργειας. Συμπληρωματικά, για τον ίδιο σκοπό, αξιοποιήθηκε τόσο το Μέσου Απόλυτο Ποσοστιαίο Σφάλμα (MAPE), όσο και το Μέσου Απόλυτου Κλιμακωμένο Σφάλμα (MASE). In business and economics, there are often applications that require forecasts of many related time series. These series, are often organized in hierarchies and therefore showcase aggregation constraints, meaning that the forecasts of the disaggregated series should naturally add up to the forecasts of the aggregated ones. There are many different approaches to achieve reconciling forecasts and ensuring coherence at different hierarchical levels, with two particular methods being the most popular ones. In particular, the first method is the “bottom-up” approach while the other one is the “top-down” approach, which can be found in more than one variation. In both approaches, the forecasts produced in a single aggregation level being the highest and the lowest one, respectively, and then are either aggregated for higher levels, or disaggregated for lower levels, resulting in the acquisition of a set of coherent forecasts for the rest of the hierarchical structure. Apart from the aforementioned approaches, the optimal forecast combination method has been used on the experimental process of the thesis. This particular method utilizes the forecasts from the complete set of the hierarchical series. Specifically, it minimizes the mean squared error of the aggregate coherent forecasts across the entire hierarchical structure under the assumption of unbiasedness. Since the “optimal” approach builds on multiple forecasts and exploits information from multiple aggregation levels, it typically results in forecasts of superior accuracy. In the present study, it is questioned whether the performance of such reconciliation approaches can be further improved, given more homogenous hierarchies that consist of series that share similar patterns and characteristics. To investigate this research question, clustering methods are first considered to group the bottom series of the original hierarchy into homogenous clusters. Then, the clusters are used to structure new hierarchies of improved homogeneity and provide alternative coherent forecasts.Furthermore, to evaluate the proposed approach a rich dataset that originates from the energy domain is considered, while two different metrics are used in order to measure forecasting accuracy, namely the Mean Absolute Percentage Error (MAPE) and the Mean Absolute Squared Error (MASE). In addition, there is an extensive theoretical analysis of the clustering methods available in literature that refers to the implementation of the clustering algorithm to the examined dataset. Finally, the particular thesis provides an analysis of the examined dataset and the presents the results of the experiments concluded, while it is also making some suggestions that could further improve the proposed methodology.

Περίληψη :

Στον τομέα της οικονομικής επιστήμης και κατ’ επέκταση της επιχειρήσεις, υπάρχουν εφαρμογές που απαιτούν προβλέψεις οι οποίες αφαιρούν χρονοσειρές. Οι εν λόγω χρονοσειρές, τυχαίνει της φορές να είναι ιεραρχικά δομημένες, έχοντας ως βάση οργάνωσης κριτήρια που αφορούν τον τύπο του προϊόντος και την γεωγραφία. Λόγω των περιορισμών συγκέντρωσης (aggregation constrains) που παρουσιάζουν οι συγκεκριμένες χρονοσειρές, έχει δημιουργηθεί η ανάγκη για την παραγωγή “συμφιλιωμένων” προβλέψεων (reconciled forecasts) σε ολόκληρη την ιεραρχία. Δηλαδή, επιχειρείται να διασφαλισθεί ότι οι προβλέψεις, αθροίζονται καταλλήλως κατά μήκος όλων των επιπέδων της ιεραρχικής δομής.Υπάρχουν της διαφορετικές προσεγγίσεις όσον αφορά την επίτευξη “συμφιλιωμένων” προβλέψεων (reconciled forecasts), καθώς και την διασφάλιση της συνοχής κατά μήκος των διαφορετικών επιπέδων της ιεραρχίας. Συγκεκριμένα, δυο από αυτές της προσεγγίσεις αποτελούν και της πιο ευρέως διαδεδομένες. Η πρώτη ονομάζεται “top-down” ενώ η δεύτερη “bottom-up”, και υπάρχει σε περισσότερες από μια παραλλαγές. Και της δύο προσεγγίσεις, σε πρώτο στάδιο οι προβλέψεις παράγονται σε ένα συγκεκριμένο επίπεδο συγκέντρωσης (aggregation level) το οποίο αποτελεί είτε το υψηλότερο επίπεδο (top-down approach) είτε το χαμηλότερο (bottom-up approach) αντιστοίχως. Έπειτα, οι προαναφερθείσες προβλέψεις είτε αθροίζονται (aggregated) για τα υψηλότερα επίπεδα, είτε διαιρούνται (disaggregated) για τα χαμηλότερα επίπεδα. Η προαναφερθείσα διαδικασία έχει ως αποτέλεσμα την παραγωγή συνεπών προβλέψεων για τα υπόλοιπα επίπεδα της ιεραρχίας. Εκτός από της προηγούμενες προσεγγίσεις, κατά την πειραματική διαδικασία της συγκεκριμένης διατριβής, χρησιμοποιήθηκε της και η “optimal forecast combination”. Η εν λόγω προσέγγιση χρησιμοποιεί της προβλέψεις που παράγονται για το πλήρες σύνολο της ιεραρχίας. Ακριβέστερα, ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα των συνολικών προβλέψεων (aggregate forecasts) κατά μήκος της της ιεραρχικής δομής. Ενώ παράλληλα εκπληρώνεται και η υπόθεση της αμεροληψίας.Δεδομένου ότι η “optimal forecast combination” βασίζεται σε πολλαπλές προβλέψεις και εκμεταλλεύεται πληροφορίες από πολλαπλά επίπεδα συγκέντρωσης (aggregation levels), συνήθως έχει ως αποτέλεσμα την παραγωγή προβλέψεων υψηλής ακρίβειας. Στην εν λόγω διατριβή τίθεται το ερώτημα σχετικά με το αν η ακρίβεια των μεθόδων συμφιλίωσης μπορεί να παρουσιάσει περαιτέρω βελτίωση, δεδομένης της δημιουργίας πιο ομοιογενών ιεραρχιών, που αποτελούνται από σειρές οι οποίες διαθέτουν παρόμοια μοτίβα και χαρακτηριστικά. Προκειμένου να διερευνηθεί το παρόν ζητούμενο, αρχικά χρησιμοποιήθηκαν μέθοδοι clustering, έτσι ώστε να πραγματοποιηθεί η ομαδοποίηση των κατώτερων σειρών της αρχικής ιεραρχίας σε ομοιογενείς συστάδες. Εν συνεχεία, οι συστάδες χρησιμοποιούνται για την δημιουργία νέων ιεραρχιών βελτιωμένης ομοιογένειας, με σκοπό την παροχή περαιτέρω συνεκτικών προβλέψεων.Τέλος, προκειμένου να αξιολογηθεί η προτεινόμενη προσέγγιση του παραπάνω ερευνητικού ζητουμένου, έγινε η χρήση της συνόλου δεδομένων το οποίο προέρχεται από τον τομέα της ενέργειας. Συμπληρωματικά, για τον ίδιο σκοπό, αξιοποιήθηκε τόσο το Μέσου Απόλυτο Ποσοστιαίο Σφάλμα (MAPE), όσο και το Μέσου Απόλυτου Κλιμακωμένο Σφάλμα (MASE).
In business and economics, there are often applications that require forecasts of many related time series. These series, are often organized in hierarchies and therefore showcase aggregation constraints, meaning that the forecasts of the disaggregated series should naturally add up to the forecasts of the aggregated ones. There are many different approaches to achieve reconciling forecasts and ensuring coherence at different hierarchical levels, with two particular methods being the most popular ones. In particular, the first method is the “bottom-up” approach while the other one is the “top-down” approach, which can be found in more than one variation. In both approaches, the forecasts produced in a single aggregation level being the highest and the lowest one, respectively, and then are either aggregated for higher levels, or disaggregated for lower levels, resulting in the acquisition of a set of coherent forecasts for the rest of the hierarchical structure. Apart from the aforementioned approaches, the optimal forecast combination method has been used on the experimental process of the thesis. This particular method utilizes the forecasts from the complete set of the hierarchical series. Specifically, it minimizes the mean squared error of the aggregate coherent forecasts across the entire hierarchical structure under the assumption of unbiasedness. Since the “optimal” approach builds on multiple forecasts and exploits information from multiple aggregation levels, it typically results in forecasts of superior accuracy. In the present study, it is questioned whether the performance of such reconciliation approaches can be further improved, given more homogenous hierarchies that consist of series that share similar patterns and characteristics. To investigate this research question, clustering methods are first considered to group the bottom series of the original hierarchy into homogenous clusters. Then, the clusters are used to structure new hierarchies of improved homogeneity and provide alternative coherent forecasts.Furthermore, to evaluate the proposed approach a rich dataset that originates from the energy domain is considered, while two different metrics are used in order to measure forecasting accuracy, namely the Mean Absolute Percentage Error (MAPE) and the Mean Absolute Squared Error (MASE). In addition, there is an extensive theoretical analysis of the clustering methods available in literature that refers to the implementation of the clustering algorithm to the examined dataset. Finally, the particular thesis provides an analysis of the examined dataset and the presents the results of the experiments concluded, while it is also making some suggestions that could further improve the proposed methodology.

Λέξη κλειδί :	Ιεραρχικές χρονοσειρές Μέθοδοι συμφιλίωσης προβλέψεων Αλγόριθμοι ομαδοποίησης μηχανικής μάθησης Αλγόριθμοι μη επιβλεπόμενης μηχανικής μάθησης Βελτίωση ακρίβειας προβλέψεων Hierarchical time series Forecast reconciliation methods Machine learning clustering algorithm Unsupervised machine learning algorithms Improving forecast accuracy

Λέξη κλειδί :

Ιεραρχικές χρονοσειρές
Μέθοδοι συμφιλίωσης προβλέψεων
Αλγόριθμοι ομαδοποίησης μηχανικής μάθησης
Αλγόριθμοι μη επιβλεπόμενης μηχανικής μάθησης
Βελτίωση ακρίβειας προβλέψεων
Hierarchical time series
Forecast reconciliation methods
Machine learning clustering algorithm
Unsupervised machine learning algorithms
Improving forecast accuracy

Διαθέσιμο από :	2022-04-05 18:07:11

Ημερομηνία έκδοσης :	03/11/2022

Ημερομηνία κατάθεσης :	2022-04-05 18:07:11

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Litras_2022.pdf

Τύπος: application/pdf

Είσοδος