Beyond isolated posts: persistent user dynamics in political misinformation on Reddit
Αρχεία
Ημερομηνία
2026-03-10
Συγγραφείς
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων / ουσα
Διαθέσιμο από
Περίληψη
This study investigates the diffusion of online misinformation by shifting the analytical focus from individual posts to user-level behavioral patterns. Using the FACTOID dataset, which contains millions of political posts from Reddit users, the analysis combines semantic text embeddings, psycholinguistic indicators derived from the LIWC framework, temporal activity patterns, and link-sharing behavior related to domain credibility and political bias. Semantic clustering techniques are applied to identify thematic communities, while supervised machine learning models including Logistic Regression, Support Vector Machines, and Random Forest, are used to classify users based on behavioral and linguistic characteristics. The findings demonstrate that behavioral signals, particularly the credibility of shared domains and repeated source-sharing patterns, are substantially stronger predictors of misinformation-related activity than emotional language indicators. In addition, the results reveal the presence of a persistent core of users who repeatedly activate during major political events, accompanied by waves of newly active accounts. Overall, the study suggests that misinformation should be conceptualized as a longitudinal behavioral dynamic rather than a series of isolated content incidents, highlighting the importance of user-level analysis for improving detection and governance strategies in digital information ecosystems.Η παρούσα μελέτη εξετάζει τη διάδοση της παραπληροφόρησης σε διαδικτυακές πλατφόρμες μετατοπίζοντας το επίκεντρο της ανάλυσης από το μεμονωμένο περιεχόμενο στο επίπεδο της συμπεριφοράς των χρηστών. Χρησιμοποιώντας το dataset FACTOID, το οποίο περιλαμβάνει εκατομμύρια πολιτικές αναρτήσεις χρηστών του Reddit, η έρευνα συνδυάζει σημασιολογικές αναπαραστάσεις κειμένου μέσω embeddings, ψυχογλωσσολογικούς δείκτες από το εργαλείο LIWC, χρονικές σειρές δραστηριότητας και μοτίβα διαμοιρασμού συνδέσμων που σχετίζονται με την αξιοπιστία και την πολιτική μεροληψία των πηγών. Παράλληλα, εφαρμόζονται τεχνικές σημασιολογικής ομαδοποίησης για τον εντοπισμό θεματικών κοινοτήτων, ενώ χρησιμοποιούνται επιβλεπόμενα μοντέλα μηχανικής μάθησης, όπως Logistic Regression, Support Vector Machines και Random Forest, για την ταξινόμηση χρηστών με βάση συμπεριφορικά και γλωσσικά χαρακτηριστικά. Τα αποτελέσματα δείχνουν ότι τα συμπεριφορικά χαρακτηριστικά, και ιδιαίτερα η αξιοπιστία των πηγών και τα επαναλαμβανόμενα μοτίβα διαμοιρασμού συνδέσμων, αποτελούν σημαντικά ισχυρότερους δείκτες παραπληροφόρησης σε σχέση με τους συναισθηματικούς γλωσσικούς δείκτες. Επιπλέον, εντοπίζεται ένας σταθερός πυρήνας χρηστών που ενεργοποιείται επανειλημμένα σε περιόδους έντονων πολιτικών γεγονότων, συνοδευόμενος από κύματα νέων λογαριασμών. Συνολικά, τα ευρήματα υποδεικνύουν ότι η παραπληροφόρηση λειτουργεί ως διαχρονική συμπεριφορική δυναμική και όχι απλώς ως μεμονωμένο πρόβλημα περιεχομένου, αναδεικνύοντας τη σημασία της ανάλυσης σε επίπεδο χρήστη για τη βελτίωση των μηχανισμών ανίχνευσης και διαχείρισης στις ψηφιακές πλατφόρμες.
Περιγραφή
Λέξεις-κλειδιά
Misinformation, Elections, Social media, Reddit, Παραπληροφόρηση, Εκλογές, Κοινωνικά δίκτυα, Αμερική

