Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Predictability in high frequency data

dc.aueb.departmentDepartment of Economics
dc.aueb.programApplied Economics
dc.contributor.opponentTzavalis, Eliasen
dc.contributor.opponentZacharias, Eleftheriosen
dc.contributor.thesisadvisorDendramis, Yiannisen
dc.creatorPlatigenis, Poliviosen
dc.creatorΠλατυγένης, Πολύβιοςel
dc.date.accessioned2025-04-03T18:20:21Z
dc.date.available2025-04-03T18:20:21Z
dc.date.issued2025-03-13
dc.description.abstractΗ παρούσα μελέτη ερευνά την προβλεψιμότητα των υψηλής συχνότητας οικονομικών δεδομένων χρησιμοποιώντας έναν συνδυασμό των παραδοσιακών οικονομετρικών μοντέλων και προηγμένων τεχνικών μηχανικής μάθησης. Τα περιβάλλοντα υψηλής συχνότητας συναλλαγών χαρακτηρίζονται από περίπλοκες κινήσεις τιμών, ακανόνιστες δομές δεδομένων και θόρυβο στη μικροδομή, προκαλώντας προκλήσεις για την βραχυπρόθεσμη ακριβή πρόβλεψη. Παρόλο που έχει γίνει εκτενής έρευνα σχετικά με την προβλεψιμότητα των χρηματοοικονομικών αγορών, υπάρχουν ακόμη κενά στην αξιολόγηση της σχετικής απόδοσης των παραδοσιακών και μηχανικής μάθησης μοντέλων στα περιβάλλοντα υψηλής συχνότητας. Για την αντιμετώπιση αυτού, η μελέτη αναλύει δεδομένα συναλλαγών και προσφορών από τέσσερις εισηγμένες εταιρείες (AAPL, GME, AUTL, και XOM) κατά τη διάρκεια πέντε συνεχόμενων ημερών συναλλαγών. Χρησιμοποιώντας τη Μέθοδο Ελάχιστων Τετραγώνων (OLS) με την Ανάλυση Κύριων Συνιστωσών (PCA), τα Δάση Τυχαίων Δέντρων, και τα Νευρωνικά Δίκτυα, η έρευνα αξιολογεί την αποτελεσματικότητα αυτών των μοντέλων στην πρόβλεψη βραχυπρόθεσμων επιστροφών συναλλαγών και της κατεύθυνσης της τιμής σε διαστήματα 5 δευτερολέπτων και 30 δευτερολέπτων. Υλοποιήθηκε μια αυστηρή διαδικασία προεπεξεργασίας δεδομένων για τον ευθυγραμμισμό και τη δημιουργία των μεταβλητών προβλέπουσας και αποκρίσεως, διασφαλίζοντας συνέπεια διαμέσου των συνεδριάσεων συναλλαγών. Τα αποτελέσματα αποκαλύπτουν ότι τα μοντέλα μηχανικής μάθησης υπερέχουν των παραδοσιακών προσεγγίσεων παλινδρόμησης, με τα Νευρωνικά Δίκτυα να επιδεικνύουν την υψηλότερη εξηγηματική ισχύ για τις προβλέψεις επιστροφών. Τα Δάση Τυχαίων Δέντρων αποτυπώνουν αποτελεσματικά τις μη-γραμμικές σχέσεις αλλά εμφανίζουν μεγαλύτερη διακύμανση στις προβλέψεις. Η κατευθυντική πρόβλεψη παραμένει εγγενώς προκλητική, με την ακρίβεια ταξινόμησης να υπερβαίνει μόνο ελαφρώς την τυχαία εικασία. Οι μετρικές ρευστότητας και διαστήματος αναδεικνύονται ως οι πιο επιδραστικές προβλέπουσες, ενισχύοντας τον ρόλο τους στη μικροδομή της αγοράς. Αυτά τα ευρήματα συμβάλλουν στη βιβλιογραφία σχετικά με την προβλεψιμότητα των υψηλής συχνότητας οικονομικών δεδομένων, επισημαίνοντας τα πλεονεκτήματα και τους περιορισμούς των διάφορων προσεγγίσεων μοντελοποίησης. Η μελέτη τονίζει την πολυπλοκότητα των βραχυπρόθεσμων προβλέψεων της αγοράς και προτείνει ότι οι μελλοντικές έρευνες διερευνήσουν στρατηγικές υβριδικής μοντελοποίησης, αρχιτεκτονικές βαθιάς μάθησης και βελτιωμένες τεχνικές μηχανικής χαρακτηριστικών για τη βελτίωση της προβλεπτικής απόδοσης. Με τον συνδυασμό οικονομετρικών και μηχανικής μάθησης μεθοδολογιών, αυτή η έρευνα παρέχει πολύτιμες πληροφορίες για το εξελισσόμενο τοπίο του υψηλής συχνότητας οικονομικού μοντελοποίησης.el
dc.description.abstractThis study investigates the predictability of high-frequency financial data using a combination of traditional econometric models and advanced machine learning techniques. High-frequency trading environments are characterized by complex price movements, irregular data structures, and microstructure noise, posing challenges for accurate short-term forecasting. While extensive research has explored financial market predictability, gaps remain in assessing the relative performance of traditional and machine learning models within high-frequency settings. To address this, the study analyzes transaction and quote data from four publicly traded companies (AAPL, GME, AUTL, and XOM) over five consecutive trading days. Using Ordinary Least Squares (OLS) with Principal Component Analysis (PCA), Random Forests, and Neural Networks, the research evaluates the effectiveness of these models in predicting short-term transaction returns and price direction at 5-second and 30-second intervals. A rigorous data preprocessing pipeline was implemented to align and construct predictor and response variables, ensuring consistency across trading sessions. The results reveal that machine learning models outperform traditional regression approaches, with Neural Networks demonstrating the highest explanatory power for return predictions. Random Forests effectively capture non-linear relationships but exhibit higher variance in predictions. Directional forecasting remains inherently challenging, with classification accuracy only slightly surpassing random guessing. Liquidity and spread metrics emerge as the most influential predictors, reinforcing their role in market microstructure. These findings contribute to the literature on high-frequency financial data predictability by highlighting the strengths and limitations of different modeling approaches. The study underscores the complexity of short-term market forecasting and suggests that future research explore hybrid modeling strategies, deep learning architectures, and refined feature engineering techniques to improve predictive performance. By combining econometric and machine learning methodologies, this research provides valuable insights into the evolving landscape of high-frequency financial modeling.en
dc.embargo.ruleOpen access
dc.format.extent257 pagesen
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/11725
dc.rightsCC0 1.0 Universalen
dc.rights.urihttp://creativecommons.org/publicdomain/zero/1.0/
dc.subjectHigh-frequency dataen
dc.subjectEconometric modelsen
dc.subjectMachine Learning (ML)en
dc.subjectΔεδομένα υψηλής συχνότηταςel
dc.subjectΟικονομετρικά μοντέλαel
dc.subjectΜηχανική μάθησηel
dc.titlePredictability in high frequency dataen
dc.title.alternativeΠροβλεψιμότητα σε δεδομένα υψηλής συχνότηταςel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Platigenis_2025.pdf
Μέγεθος:
12.16 MB
Μορφότυπο:
Adobe Portable Document Format