Περίληψη : | Εκτός από την χρήση του ως ψηφιακό κατανεμημένο σύστημα πληρωμών, το blockchain του Bitcoin, έχει επίσης χρησιμοποιηθεί για την αποθήκευση αυθαίρετου περιεχομένου λόγω της αμετάβλητης φύσης του. Αυτό κυμαίνεται από δεδομένα κειμένου έως αρχεία όπως εικόνες, που συχνά περιέχουν συνδέσμους, αφιερώματα και παράνομο περιεχόμενο. Σε αντίθεση με την υπάρχουσα βιβλιογραφία που ταξινομεί αυτά τα δεδομένα είτε εποπτικά είτε με τη χρήση ευρετικών μεθόδων, η παρούσα εργασία προτείνει τη χρήση τεχνικών επεξεργασίας φυσικής γλώσσας για την ανάλυση του αυθαίρετου περιεχομένου, ανοίγοντας το δρόμο για αυτόματες καινοτόμες προσεγγίσεις στην ανάλυση και τον εντοπισμό του δημόσιου συναισθήματος που υπάρχει κωδικοποιημένο στο blockchain. Έμφαση δίνεται στην ανακάλυψη πιθανών συσχετίσεων μεταξύ μηνυμάτων με στόχο την αλλαγή της δυναμικής της χρηματοπιστωτικής αγοράς, ιδίως στην αγορά των κρυπτονομισμάτων. Χρησιμοποιώντας στατιστικούς ελέγχους και προσεγγίσεις Μηχανικής Μάθησης διαπιστώνουμε για πρώτη φορά, την ύπαρξη συσχετίσεων και την προβλεπτική ικανότητα του συναισθήματος των μηνυμάτων που ενσωματώνονται στα blockchains των δύο πιο δημοφιλών κρυπτονομισμάτων, του Bitcoin και του Ethereum, με τις διακυμάνσεις των τιμών τους. Μέσω αυτής της διερεύνησης, συμβάλλουμε στον τομέα του blockchain analytics, προτείνοντας την Επεξεργασία Φυσικής Γλώσσας ως ένα ισχυρό εργαλείο για την επεξεργασία δεδομένων του blockchain για την ανάλυση συναισθήματος και την θεματική ανάλυση Apart from its apparent use as a digital distributed payment system, Bitcoin's blockchain, since its genesis, has also been used to store arbitrary content due to its immutable nature. This ranges from text data to files such as images, often containing links, tributes, and illegal content. Contradictory to existing literature that classifies this data either manually or by utilizing hand-made heuristics, this work proposes the use of Natural Language Processing techniques for the analysis of mined arbitrary text content, paving the way for automatic innovative approaches in analyzing and detecting public sentiment embedded in the blockchain. Emphasis is given to unearthing potential correlations between messages aiming to alter financial market dynamics, particularly in the cryptocurrency market. Using statistical tests and Machine Learning approaches we establish for the first time the existence of associations and predictive power of the sentiment of the messages embedded in the two most popular cryptocurrencies’ blockchains, Bitcoin and Ethereum, to their price fluctuations. Through this exploration, we contribute to the field of blockchain analytics by introducing Natural Language Processing as a robust framework for harnessing blockchain data for sentiment and thematic analysis.
|
---|