Συλλογές
Τίτλος Deep learning models for corporate event prediction: using text and financial indicators
Εναλλακτικός τίτλος Μοντέλα βαθιάς μάθησης για πρόβλεψη εταιρικών γεγονότων: χρήση κειμένου και χρηματοοικονομικών δεικτών
Δημιουργός Μαμάκας, Δημήτριος, Mamakas, Dimitrios
Συντελεστής Athens University of Economics and Business, Department of Informatics
Galanis, Dimitrios
Leledakis, Georgios
Androutsopoulos, Ion
Τύπος Text
Φυσική περιγραφή 107p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10962
Περίληψη During the past decades, Initial Public Offerings (IPOs) evolved into an irreplaceable tool for companies to raise capital. Generally, IPOs describe the procedure of offering private corporative shares to the primary market, thus attracting institutional and individual investors to purchase them. Afterward, the securities become available in the secondary market and are easily traded by individuals. Typically, when U.S. firms go public, they follow an explicit procedure. Specifically, the U.S. Securities and Exchange Commission (SEC) requires the submission of the S-1 filing document (also referred to as IPO prospectus) to the Electronic Data Gathering, Analysis, and Retrieval (EDGAR) system. This clause ensures investors have prior knowledge of the issuing company’s valuation, potential risks, or future business plans. Hence, IPO underpricing received considerable attention through the years by triggering economists and financial experts. Overall, underpricing denotes offering an IPO at a price lower than its entered value on the stock market after the first trading day. The opposite scenario indicates IPO overpricing. To investigate these phenomena, previous work applied conventional Machine Learning (ML) techniques that use features retrieved from the S-1 fillings or specific financial indications to classify IPOs. However, measuring the predictive power of the prospectuses becomes a complicated task because of the imposition of processing limitations due to their large document size, as they contain a considerably high number of words, making them hard to process and analyze. Therefore, in this study, we go beyond previous approaches and investigate the predictive power of IPOs by utilizing pre-trained Transformers. To detect underpricing, we use textual information retrieved from S-1 fillings along with economic knowledge coming from specific financial indicators. We introduce a collection of models that process texts of up to 20,480 tokens, and finally, the findings indicate that our methods outperform previous ML approaches in most experiments.
Τις τελευταίες δεκαετίες, οι Αρχικές Δημόσιες Εγγραφές (Initial Public Offerings) εξελίχθηκαν σε ένα αναντικατάστατο εργαλείο για την άντληση μετοχικών κεφαλαίων. Γενικά, τα IPO περιγράφουν τη διαδικασία προσφοράς ιδιωτικών εταιρικών μετοχών στην πρωτογενή αγορά, προσελκύοντας επενδυτές για την αγορά τους. Στη συνέχεια, οι τίτλοι καθίστανται διαθέσιμοι στη δευτερογενή αγορά, όπου γίνονται εύκολα αντικείμενο διαπραγμάτευσης από ιδιώτες. Συνήθως, όταν οι αμερικανικές επιχειρήσεις εισέρχονται στο χρηματιστήριο, ακολουθούν μια ρητή προκαθορισμένη διαδικασία. Συγκεκριμένα, η Επιτροπή Κεφαλαιαγοράς (SEC) απαιτεί την υποβολή του εγγράφου κατάθεσης S-1 στο σύστημα EDGAR (Electronic Data Gathering, Analysis, and Retrieval), διασφαλίζοντας πως οι επενδυτές έχουν εκ των προτέρων γνώση της αποτίμησης, των πιθανών κινδύνων ή των μελλοντικών επιχειρηματικών σχεδίων της εκδότριας εταιρείας. Ως εκ τούτου, η υποτιμολόγηση (underpricing) των IPO τυγχάνει σημαντικής προσοχής, προκαλώντας το ενδιαφέρον οικονομολόγων και χρηματοοικονομικών εμπειρογνωμόνων. Υποτιμολόγηση έχουμε όταν η προσφερόμενη τιμή είναι μικρότερη από την τιμή κλεισίματος της μετοχής κατά την πρώτη ημέρα διαπραγμάτευσης. Το αντίθετο σενάριο υποδηλώνει υπερτιμολόγηση (overpricing). Για τη διερεύνηση αυτών των φαινομένων, προηγούμενη βιβλιογραφία εφάρμοζε βασικές τεχνικές Μηχανικής Μάθησης οι οποίες χρησιμοποιούσαν χαρακτηριστικά που ανακτώνται από τα ίδια τα S-1, ή συγκεκριμένες χρηματοοικονομικές μεταβλητές για την ταξινόμηση των IPO. Ωστόσο, η μέτρηση της ικανότητας των S-1 στης πρόβλεψη φαινομένων υποτιμολόγησης καθίσταται μία περίπλοκη διαδικασία, καθώς τίθενται περιορισμοί στην επεξεργασία των κειμένων λόγω του μεγάλου μεγέθους τους, γεγονός που καθιστά δύσκολη την επεξεργασία και την ανάλυσή τους. Ως εκ τούτου, στην παρούσα μελέτη, υπερβαίνουμε τις προηγούμενες προσεγγίσεις Μηχανικής Μάθησης, και διερευνούμε την προγνωστική δύναμη των IPO εφαρμόζοντας προ-εκπαιδευμένους Transformers. Για να ανιχνεύσουμε την υποτιμολόγηση, χρησιμοποιούμε πληροφορίες κειμένου που ανακτώνται από τα ίδια τα S-1 μαζί με ειδικές γνώσεις που προέρχονται από ορισμένους χρηματοοικονομικούς δείκτες, παρουσιάζοντας μια συλλογή μοντέλων που επεξεργάζονται κείμενα μήκους έως και 20.480 λέξεων. Τέλος, αποδεικνύουμε την ανωτερότητα των μεθόδων μας έναντι των προηγούμενων προσεγγίσεων στα περισσότερα πειράματα.
Λέξη κλειδί Προ-εκπαιδευμένοι transformer
Αρχικές δημόσιες εγγραφές
Χρηματοοικονομικά
Βαθιά μάθηση
Κατηγοριοποίηση μεγάλων εγγράφων
Deep learning
Initial Public Offerings (IPOs)
Finance
Pre-trained transformers
Large document classification
Διαθέσιμο από 2024-01-09 14:40:47
Ημερομηνία έκδοσης 21-12-2023
Ημερομηνία κατάθεσης 2024-01-09 14:40:47
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/