PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Deep learning models for corporate event prediction: using text and financial indicators
Alternative Title :Μοντέλα βαθιάς μάθησης για πρόβλεψη εταιρικών γεγονότων: χρήση κειμένου και χρηματοοικονομικών δεικτών
Creator :Μαμάκας, Δημήτριος
Mamakas, Dimitrios
Contributor :Androutsopoulos, Ion (Επιβλέπων καθηγητής)
Leledakis, Georgios (Εξεταστής)
Galanis, Dimitrios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Extent :107p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10962
Abstract :Τις τελευταίες δεκαετίες, οι Αρχικές Δημόσιες Εγγραφές (Initial Public Offerings) εξελίχθηκαν σε ένα αναντικατάστατο εργαλείο για την άντληση μετοχικών κεφαλαίων. Γενικά, τα IPO περιγράφουν τη διαδικασία προσφοράς ιδιωτικών εταιρικών μετοχών στην πρωτογενή αγορά, προσελκύοντας επενδυτές για την αγορά τους. Στη συνέχεια, οι τίτλοι καθίστανται διαθέσιμοι στη δευτερογενή αγορά, όπου γίνονται εύκολα αντικείμενο διαπραγμάτευσης από ιδιώτες. Συνήθως, όταν οι αμερικανικές επιχειρήσεις εισέρχονται στο χρηματιστήριο, ακολουθούν μια ρητή προκαθορισμένη διαδικασία. Συγκεκριμένα, η Επιτροπή Κεφαλαιαγοράς (SEC) απαιτεί την υποβολή του εγγράφου κατάθεσης S-1 στο σύστημα EDGAR (Electronic Data Gathering, Analysis, and Retrieval), διασφαλίζοντας πως οι επενδυτές έχουν εκ των προτέρων γνώση της αποτίμησης, των πιθανών κινδύνων ή των μελλοντικών επιχειρηματικών σχεδίων της εκδότριας εταιρείας. Ως εκ τούτου, η υποτιμολόγηση (underpricing) των IPO τυγχάνει σημαντικής προσοχής, προκαλώντας το ενδιαφέρον οικονομολόγων και χρηματοοικονομικών εμπειρογνωμόνων. Υποτιμολόγηση έχουμε όταν η προσφερόμενη τιμή είναι μικρότερη από την τιμή κλεισίματος της μετοχής κατά την πρώτη ημέρα διαπραγμάτευσης. Το αντίθετο σενάριο υποδηλώνει υπερτιμολόγηση (overpricing). Για τη διερεύνηση αυτών των φαινομένων, προηγούμενη βιβλιογραφία εφάρμοζε βασικές τεχνικές Μηχανικής Μάθησης οι οποίες χρησιμοποιούσαν χαρακτηριστικά που ανακτώνται από τα ίδια τα S-1, ή συγκεκριμένες χρηματοοικονομικές μεταβλητές για την ταξινόμηση των IPO. Ωστόσο, η μέτρηση της ικανότητας των S-1 στης πρόβλεψη φαινομένων υποτιμολόγησης καθίσταται μία περίπλοκη διαδικασία, καθώς τίθενται περιορισμοί στην επεξεργασία των κειμένων λόγω του μεγάλου μεγέθους τους, γεγονός που καθιστά δύσκολη την επεξεργασία και την ανάλυσή τους. Ως εκ τούτου, στην παρούσα μελέτη, υπερβαίνουμε τις προηγούμενες προσεγγίσεις Μηχανικής Μάθησης, και διερευνούμε την προγνωστική δύναμη των IPO εφαρμόζοντας προ-εκπαιδευμένους Transformers. Για να ανιχνεύσουμε την υποτιμολόγηση, χρησιμοποιούμε πληροφορίες κειμένου που ανακτώνται από τα ίδια τα S-1 μαζί με ειδικές γνώσεις που προέρχονται από ορισμένους χρηματοοικονομικούς δείκτες, παρουσιάζοντας μια συλλογή μοντέλων που επεξεργάζονται κείμενα μήκους έως και 20.480 λέξεων. Τέλος, αποδεικνύουμε την ανωτερότητα των μεθόδων μας έναντι των προηγούμενων προσεγγίσεων στα περισσότερα πειράματα.
During the past decades, Initial Public Offerings (IPOs) evolved into an irreplaceable tool for companies to raise capital. Generally, IPOs describe the procedure of offering private corporative shares to the primary market, thus attracting institutional and individual investors to purchase them. Afterward, the securities become available in the secondary market and are easily traded by individuals. Typically, when U.S. firms go public, they follow an explicit procedure. Specifically, the U.S. Securities and Exchange Commission (SEC) requires the submission of the S-1 filing document (also referred to as IPO prospectus) to the Electronic Data Gathering, Analysis, and Retrieval (EDGAR) system. This clause ensures investors have prior knowledge of the issuing company’s valuation, potential risks, or future business plans. Hence, IPO underpricing received considerable attention through the years by triggering economists and financial experts. Overall, underpricing denotes offering an IPO at a price lower than its entered value on the stock market after the first trading day. The opposite scenario indicates IPO overpricing. To investigate these phenomena, previous work applied conventional Machine Learning (ML) techniques that use features retrieved from the S-1 fillings or specific financial indications to classify IPOs. However, measuring the predictive power of the prospectuses becomes a complicated task because of the imposition of processing limitations due to their large document size, as they contain a considerably high number of words, making them hard to process and analyze. Therefore, in this study, we go beyond previous approaches and investigate the predictive power of IPOs by utilizing pre-trained Transformers. To detect underpricing, we use textual information retrieved from S-1 fillings along with economic knowledge coming from specific financial indicators. We introduce a collection of models that process texts of up to 20,480 tokens, and finally, the findings indicate that our methods outperform previous ML approaches in most experiments.
Subject :Βαθιά μάθηση
Αρχικές δημόσιες εγγραφές
Χρηματοοικονομικά
Προ-εκπαιδευμένοι transformer
Κατηγοριοποίηση μεγάλων εγγράφων
Deep learning
Initial Public Offerings (IPOs)
Finance
Pre-trained transformers
Large document classification
Date Available :2024-01-09 14:40:47
Date Issued :21-12-2023
Date Submitted :2024-01-09 14:40:47
Access Rights :Free access
Licence :

File: Mamakas_2023.pdf

Type: application/pdf