PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Factor investing with machine learning: a comprehensive analysis of financial predictors for stock returns
Alternative Title :Επενδυτική στρατηγική βάσει παραγόντων με τη χρήση μηχανικής μάθησης: μια ολοκληρωμένη ανάλυση των χρηματοοικονομικών προγνωστικών παραγόντων για τις αποδόσεις των μετοχών
Creator :Θεοδώρου, Κωνσταντίνος
Theodorou, Konstantinos
Contributor :Rompolis, Leonidas (Επιβλέπων καθηγητής)
Sakkas, Athanasios (Εξεταστής)
Chalamandaris, George (Εξεταστής)
Athens University of Economics and Business, Department of Accounting and Finance (Degree granting institution)
Type :Text
Extent :74p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11746
Abstract :Ο κύριος στόχος αυτής της διατριβής είναι να εξερευνήσει τις δυνατότητες των αλγορίθμων Μηχανικής Μάθησης για την ενίσχυση των προβλεπτικών ικανοτήτων της επενδυτικής στρατηγικής βάσει παραγόντων στον χρηματοοικονομικό τομέα. Τα παραδοσιακά χρηματοοικονομικά μοντέλα συχνά βασίζονται σε γραμμικές υποθέσεις και απλοποιημένες απόψεις της συμπεριφοράς της αγοράς, γεγονός που μπορεί να περιορίσει την αποτελεσματικότητά τους στην αποτύπωση των πολυπλοκοτήτων των πραγματικών χρηματοοικονομικών αγορών. Ωστόσο, οι πρόσφατες εξελίξεις στη Μηχανική Μάθηση έχουν εισαγάγει τη δυνατότητα ανίχνευσης και μοντελοποίησης σύνθετων, μη γραμμικών σχέσεων μεταξύ πολλαπλών παραγόντων, προσφέροντας μια σημαντική ευκαιρία για τη βελτίωση και την αναβάθμιση των επενδυτικών στρατηγικών. Αυτή η μελέτη διερευνά πώς αυτές οι προηγμένες υπολογιστικές τεχνικές μπορούν να ενισχύσουν την απόδοση και την ακρίβεια της επενδυτικής στρατηγικής με βάση τους παράγοντες, αποκαλύπτοντας κρυμμένα πρότυπα, βελτιστοποιώντας τις επενδυτικές αποφάσεις και τελικά βελτιώνοντας τη διαδικασία διαχείρισης χαρτοφυλακίου. Η εμπειρική ανάλυση που διεξάγεται σε αυτή την έρευνα αξιολογεί ένα ολοκληρωμένο σύνολο 480 χρηματοοικονομικών μεταβλητών ή παραγόντων, αξιολογώντας την προβλεπτική τους αποτελεσματικότητα και την εξηγητική τους δύναμη στην πρόβλεψη των αποδόσεων των μετοχών. Αυτοί οι παράγοντες προέρχονται από ένα ευρύ φάσμα χρηματοοικονομικών και αγοραίων δεδομένων, με έντονη εστίαση στους δείκτες απόδοσης των εταιρειών, οι οποίοι περιλαμβάνουν δείκτες όπως η κερδοφορία, οι ρυθμοί ανάπτυξης και οι παράγοντες κινδύνου. Η μελέτη εξετάζει συγκεκριμένα τις δημόσια διαπραγματευόμενες εταιρείες του δείκτη S&P 500, παρέχοντας ένα ισχυρό δείγμα εταιρειών που αντιπροσωπεύουν ένα ευρύ φάσμα βιομηχανιών, επιχειρηματικών κύκλων και προφίλ κινδύνου. Η έρευνα καλύπτει μια σημαντική χρονική περίοδο, από τον Ιανουάριο του 2002 έως τον Δεκέμβριο του 2023, καλύπτοντας πολλαπλούς οικονομικούς κύκλους, όπως περιόδους οικονομικής ανάπτυξης, χρηματοοικονομικές κρίσεις και ανακάμψεις της αγοράς. Αυτό το εκτεταμένο χρονικό πλαίσιο προσφέρει μια ολοκληρωμένη προοπτική για το πώς εξελίσσονται οι δυναμικές της αγοράς υπό διαφορετικές συνθήκες, εμπλουτίζοντας την ανάλυση του πώς διάφοροι παράγοντες επηρεάζουν τις αποδόσεις των μετοχών με την πάροδο του χρόνου. Τα ευρήματα αυτής της μελέτης παρέχουν πολύτιμες πληροφορίες για την προβλεπτική δύναμη των μεμονωμένων χρηματοοικονομικών μεταβλητών, καθώς και για τις σύνθετες αλληλεπιδράσεις μεταξύ αυτών των μεταβλητών και της απόδοσης της χρηματιστηριακής αγοράς. Μια βασική συμβολή αυτής της έρευνας είναι η ενσωμάτωση προηγμένων μοντέλων μηχανικής μάθησης στο πλαίσιο της επενδυτικής στρατηγικής με βάση τους παράγοντες, η οποία καταδεικνύει τα οφέλη της αξιοποίησης των πιο σύγχρονων τεχνολογιών για τη βελτίωση και την αναβάθμιση των επενδυτικών στρατηγικών. Η μελέτη χρησιμοποιεί μια ποικιλία αλγορίθμων επιβλεπόμενης μάθησης, συμπεριλαμβανομένων των Γραμμικών Παλινδρομήσεων (Linear Regression), του μοντέλου Τυχαίου Δάσους (Random Forest), του μοντέλου Ενίσχυσης Κλίσης (Gradient Boosting), του μοντέλου Προσαρμοστικής Ενίσχυσης (AdaBoost), του μοντέλου Κ-Πλησιέστερων Γειτόνων (KNN), του μοντέλου Μηχανών Υποστήριξης Διανυσμάτων (SVMs), του μοντέλου Ενίσχυσης Βασισμένη σε Ιστογράμματα (HBB), και του μοντέλου Ενίσχυσης Ακραίας Κλίσης (XGBoost), με την εφαρμογή ρύθμισης υπερπαραμέτρων και 5-πτυχιακής διασταυρούμενης επικύρωσης, για τη βελτιστοποίηση των μοντέλων και την αξιολόγηση της ακρίβειας και της ανθεκτικότητάς τους στην πρόβλεψη των μελλοντικών αποδόσεων των μετοχών. Αυτή η επαναληπτική διαδικασία περιλαμβάνει τη βελτίωση των μοντέλων μέσω διαφόρων προσαρμογών για να διασφαλιστεί ότι γενικεύονται καλά σε νέα, αόρατα δεδομένα, αποτρέποντας την υπερπροσαρμογή στις παρελθούσες τάσεις της αγοράς και ενισχύοντας την προβλεπτική τους αξιοπιστία. Επιπλέον, η ανάλυση τονίζει τον μετασχηματιστικό αντίκτυπο που μπορούν να έχουν οι τεχνολογίες μηχανικής μάθησης στη λήψη επενδυτικών αποφάσεων, προσφέροντας μια προσέγγιση βασισμένη στα δεδομένα που έχει τη δυνατότητα να υπερβεί τα παραδοσιακά χρηματοοικονομικά μοντέλα. Τα αποτελέσματα υπογραμμίζουν τη σημασία της υιοθέτησης νέων τεχνολογιών στο εξελισσόμενο τοπίο των χρηματοοικονομικών, υποδεικνύοντας ότι η μηχανική μάθηση έχει τη δυνατότητα να επαναστατικοποιήσει την επενδυτική στρατηγική με βάση τους παράγοντες, βελτιώνοντας την προβλεπτική ακρίβεια και δημιουργώντας εφαρμόσιμες πληροφορίες που μπορούν να καθοδηγήσουν πιο ενημερωμένες επενδυτικές αποφάσεις. Συμπερασματικά, αυτή η διατριβή αναδεικνύει τη σύγκλιση της χρηματοοικονομικής βασισμένης στα δεδομένα και της μηχανικής μάθησης, παρουσιάζοντας νέες ευκαιρίες για την ενίσχυση των επενδυτικών στρατηγικών, την αναγνώριση κερδοφόρων παραγόντων και την πραγματοποίηση πιο ακριβών προβλέψεων για τις αποδόσεις των μετοχών. Τα ευρήματα όχι μόνο προσφέρουν πολύτιμες πληροφορίες για τις πρακτικές εφαρμογές της μηχανικής μάθησης στα χρηματοοικονομικά, αλλά επίσης παρέχουν μια βάση για μελλοντική έρευνα σε αυτόν τον ταχέως εξελισσόμενο και υποσχόμενο τομέα.
The primary aim of this thesis is to explore the potential of Machine Learning (ML) algorithms to enhance the predictive capabilities of factor investing within the financial sector. Traditional financial models have often relied on linear assumptions and simplified views of market behavior, which can limit their effectiveness in capturing the complexities of real-world financial markets. However, recent advancements in ML have introduced the ability to detect and model complex, non-linear relationships between multiple factors, offering a significant opportunity to refine and improve investment strategies. This study investigates how these advanced computational techniques can enhance the performance and accuracy of factor investing by uncovering hidden patterns, optimizing investment decisions, and ultimately improving the portfolio management process.The empirical analysis conducted in this research evaluates a comprehensive set of 480 financial variables, or factors, assessing their predictive efficacy and explanatory power in forecasting stock returns. These factors are sourced from a diverse range of financial and market data, with a strong focus on company-specific performance metrics, which include indicators such as profitability, growth rates, and risk factors. The study specifically examines publicly traded companies within the S&P 500 index, providing a robust sample of firms that represent a broad spectrum of industries, business cycles, and risk profiles. The research spans a significant time period, from January 2002 to December 2023, covering multiple economic cycles, such as periods of economic growth, financial crises, and market recoveries. This extended time frame offers a comprehensive perspective on how market dynamics evolve under different conditions, enriching the analysis of how various factors influence stock returns over time.The findings of this study provide valuable insights into the predictive power of individual financial variables, as well as the complex interactions between these variables and stock market performance. A key contribution of this research is the integration of advanced machine learning models into the factor investing framework, which demonstrates the benefits of leveraging cutting-edge technologies to refine and enhance investment strategies. The study employs a variety of supervised learning algorithms, including Linear Regression, Random Forest, Gradient Boosting, AdaBoost, K-Nearest Neighbors (KNN), Support Vector Machines (SVM), Histogram-Based Boosting, and eXtreme Gradient Boosting (XGBoost), with the application of hyperparameter tuning and 5-fold cross-validation, to optimize the models and assess their accuracy and robustness in predicting future stock returns. This iterative process involves refining the models through various adjustments to ensure that they generalize well to new, unseen data, preventing overfitting to past market trends and enhancing their predictive reliability.Furthermore, the analysis emphasizes the transformative impact that machine learning technologies can have on investment decision-making, offering a data-driven approach that holds the potential to outperform traditional financial models. The results underscore the importance of embracing new technologies in the evolving landscape of finance, suggesting that machine learning has the potential to revolutionize factor investing by improving predictive accuracy and generating actionable insights that can guide more informed investment decisions.In conclusion, this thesis highlights the convergence of data-driven finance and machine learning, presenting new opportunities to enhance investment strategies, identify profitable factors, and make more accurate predictions about stock returns. The findings not only offer valuable insights into the practical applications of machine learning in finance but also provide a foundation for future research in this rapidly advancing and promising field.
Subject :Επενδυτική στρατηγική βάσει παραγόντων
Αλγόριθμοι μηχανικής μάθησης
Ρύθμιση υπερπαραμέτρων
5-πτυχή διασταυρούμενη επικύρωση
Πρόβλεψη αποδόσεων μετοχών
Factor investing
Machine learning algorithms
Hyperparameter tuning
5-fold cross validation
Stock return forecasting
Date Issued :12-12-2024
Date Submitted :12-12-2024
Date Accepted :12-12-2024
Licence :

File: Theodorou_2024.pdf

Type: application/pdf