Predictability in high frequency data
dc.aueb.department | Department of Economics | |
dc.aueb.program | Applied Economics | |
dc.contributor.opponent | Tzavalis, Elias | en |
dc.contributor.opponent | Zacharias, Eleftherios | en |
dc.contributor.thesisadvisor | Dendramis, Yiannis | en |
dc.creator | Platigenis, Polivios | en |
dc.creator | Πλατυγένης, Πολύβιος | el |
dc.date.accessioned | 2025-04-03T18:20:21Z | |
dc.date.available | 2025-04-03T18:20:21Z | |
dc.date.issued | 2025-03-13 | |
dc.description.abstract | Η παρούσα μελέτη ερευνά την προβλεψιμότητα των υψηλής συχνότητας οικονομικών δεδομένων χρησιμοποιώντας έναν συνδυασμό των παραδοσιακών οικονομετρικών μοντέλων και προηγμένων τεχνικών μηχανικής μάθησης. Τα περιβάλλοντα υψηλής συχνότητας συναλλαγών χαρακτηρίζονται από περίπλοκες κινήσεις τιμών, ακανόνιστες δομές δεδομένων και θόρυβο στη μικροδομή, προκαλώντας προκλήσεις για την βραχυπρόθεσμη ακριβή πρόβλεψη. Παρόλο που έχει γίνει εκτενής έρευνα σχετικά με την προβλεψιμότητα των χρηματοοικονομικών αγορών, υπάρχουν ακόμη κενά στην αξιολόγηση της σχετικής απόδοσης των παραδοσιακών και μηχανικής μάθησης μοντέλων στα περιβάλλοντα υψηλής συχνότητας. Για την αντιμετώπιση αυτού, η μελέτη αναλύει δεδομένα συναλλαγών και προσφορών από τέσσερις εισηγμένες εταιρείες (AAPL, GME, AUTL, και XOM) κατά τη διάρκεια πέντε συνεχόμενων ημερών συναλλαγών. Χρησιμοποιώντας τη Μέθοδο Ελάχιστων Τετραγώνων (OLS) με την Ανάλυση Κύριων Συνιστωσών (PCA), τα Δάση Τυχαίων Δέντρων, και τα Νευρωνικά Δίκτυα, η έρευνα αξιολογεί την αποτελεσματικότητα αυτών των μοντέλων στην πρόβλεψη βραχυπρόθεσμων επιστροφών συναλλαγών και της κατεύθυνσης της τιμής σε διαστήματα 5 δευτερολέπτων και 30 δευτερολέπτων. Υλοποιήθηκε μια αυστηρή διαδικασία προεπεξεργασίας δεδομένων για τον ευθυγραμμισμό και τη δημιουργία των μεταβλητών προβλέπουσας και αποκρίσεως, διασφαλίζοντας συνέπεια διαμέσου των συνεδριάσεων συναλλαγών. Τα αποτελέσματα αποκαλύπτουν ότι τα μοντέλα μηχανικής μάθησης υπερέχουν των παραδοσιακών προσεγγίσεων παλινδρόμησης, με τα Νευρωνικά Δίκτυα να επιδεικνύουν την υψηλότερη εξηγηματική ισχύ για τις προβλέψεις επιστροφών. Τα Δάση Τυχαίων Δέντρων αποτυπώνουν αποτελεσματικά τις μη-γραμμικές σχέσεις αλλά εμφανίζουν μεγαλύτερη διακύμανση στις προβλέψεις. Η κατευθυντική πρόβλεψη παραμένει εγγενώς προκλητική, με την ακρίβεια ταξινόμησης να υπερβαίνει μόνο ελαφρώς την τυχαία εικασία. Οι μετρικές ρευστότητας και διαστήματος αναδεικνύονται ως οι πιο επιδραστικές προβλέπουσες, ενισχύοντας τον ρόλο τους στη μικροδομή της αγοράς. Αυτά τα ευρήματα συμβάλλουν στη βιβλιογραφία σχετικά με την προβλεψιμότητα των υψηλής συχνότητας οικονομικών δεδομένων, επισημαίνοντας τα πλεονεκτήματα και τους περιορισμούς των διάφορων προσεγγίσεων μοντελοποίησης. Η μελέτη τονίζει την πολυπλοκότητα των βραχυπρόθεσμων προβλέψεων της αγοράς και προτείνει ότι οι μελλοντικές έρευνες διερευνήσουν στρατηγικές υβριδικής μοντελοποίησης, αρχιτεκτονικές βαθιάς μάθησης και βελτιωμένες τεχνικές μηχανικής χαρακτηριστικών για τη βελτίωση της προβλεπτικής απόδοσης. Με τον συνδυασμό οικονομετρικών και μηχανικής μάθησης μεθοδολογιών, αυτή η έρευνα παρέχει πολύτιμες πληροφορίες για το εξελισσόμενο τοπίο του υψηλής συχνότητας οικονομικού μοντελοποίησης. | el |
dc.description.abstract | This study investigates the predictability of high-frequency financial data using a combination of traditional econometric models and advanced machine learning techniques. High-frequency trading environments are characterized by complex price movements, irregular data structures, and microstructure noise, posing challenges for accurate short-term forecasting. While extensive research has explored financial market predictability, gaps remain in assessing the relative performance of traditional and machine learning models within high-frequency settings. To address this, the study analyzes transaction and quote data from four publicly traded companies (AAPL, GME, AUTL, and XOM) over five consecutive trading days. Using Ordinary Least Squares (OLS) with Principal Component Analysis (PCA), Random Forests, and Neural Networks, the research evaluates the effectiveness of these models in predicting short-term transaction returns and price direction at 5-second and 30-second intervals. A rigorous data preprocessing pipeline was implemented to align and construct predictor and response variables, ensuring consistency across trading sessions. The results reveal that machine learning models outperform traditional regression approaches, with Neural Networks demonstrating the highest explanatory power for return predictions. Random Forests effectively capture non-linear relationships but exhibit higher variance in predictions. Directional forecasting remains inherently challenging, with classification accuracy only slightly surpassing random guessing. Liquidity and spread metrics emerge as the most influential predictors, reinforcing their role in market microstructure. These findings contribute to the literature on high-frequency financial data predictability by highlighting the strengths and limitations of different modeling approaches. The study underscores the complexity of short-term market forecasting and suggests that future research explore hybrid modeling strategies, deep learning architectures, and refined feature engineering techniques to improve predictive performance. By combining econometric and machine learning methodologies, this research provides valuable insights into the evolving landscape of high-frequency financial modeling. | en |
dc.embargo.rule | Open access | |
dc.format.extent | 257 pages | en |
dc.identifier.uri | https://pyxida.aueb.gr/handle/123456789/11725 | |
dc.rights | CC0 1.0 Universal | en |
dc.rights.uri | http://creativecommons.org/publicdomain/zero/1.0/ | |
dc.subject | High-frequency data | en |
dc.subject | Econometric models | en |
dc.subject | Machine Learning (ML) | en |
dc.subject | Δεδομένα υψηλής συχνότητας | el |
dc.subject | Οικονομετρικά μοντέλα | el |
dc.subject | Μηχανική μάθηση | el |
dc.title | Predictability in high frequency data | en |
dc.title.alternative | Προβλεψιμότητα σε δεδομένα υψηλής συχνότητας | el |
dc.type | Text |
Αρχεία
Πρωτότυπος φάκελος/πακέτο
1 - 1 από 1
Φόρτωση...
- Ονομα:
- Platigenis_2025.pdf
- Μέγεθος:
- 12.16 MB
- Μορφότυπο:
- Adobe Portable Document Format