Capturing temporal patterns in deliberations and discussions
Ημερομηνία
26-11-2024
Συγγραφείς
Μπαλής, Ραφαήλ
Mpalis, Rafail
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων
Διαθέσιμο από
2024-12-05 00:13:34
Περίληψη
Η παρούσα διπλωματική εργασία διερευνά καινοτόμες προσεγγίσεις για τη σύνοψη και την απεικόνιση σχολίων (αναρτήσεων) από διαδικτυακές συζητήσεις και αξιολογήσεις, χρησιμοποιώντας έναν συνδυασμό παραδοσιακών μεθόδων μηχανικής μάθησης και Μεγάλων Γλωσσικών Μοντέλων γνωστά και ως “LLMs”. Η έρευνα επικεντρώνεται σε μεθόδους που περιλαμβάνουν ομαδοποίηση βάσει χρονικής σήμανσης, συσταδοποίηση, εξαγωγή θεμάτων και σύνοψη βάσει ετικετών (labeling), με στόχο τη βελτίωση της επεξεργασίας διαδικτυακών συζητήσεων ή σχολίων χρηστών. Εφαρμόζοντας αυτές τις μεθόδους σε διάφορα σύνολα δεδομένων, αξιολογούμε την απόδοσή τους χρησιμοποιώντας μετρικές όπως BLEU, ROUGE και BERTscore. Τα αποτελέσματα καταδεικνύουν την αποτελεσματικότητα των μοντέλων “Transformer”, ιδιαίτερα όταν συνδυάζονται με προηγμένες τεχνικές Μηχανικής Μάθησης, στη δημιουργία συνεκτικών και ακριβών συνοψίσεων. Η μελέτη αυτή συμβάλλει στην ανάπτυξη αποδοτικών αυτοματοποιημένων τεχνικών σύνοψης, προσφέροντας πολύτιμες γνώσεις για εφαρμογές σε πραγματικό χρόνο και επεξεργασία περιεχομένου συγκεκριμένων τομέων.This thesis investigates innovative approaches for summarizing and visualizing comments (post) from online discussions and reviews using a combination of traditional machine learning methods and state-of-the-art Large Language Models (LLMs). The research focuses on methods consisting of grouping by timestamp, clustering, topic extraction, and label-based summarization to enhance the processing of online discussions or user-generated reviews. By applying these methods to various datasets, we evaluate their performance using metrics such as BLEU, ROUGE, and BERTscore. The results demonstrate the effectiveness of Transformer-based models, particularly when combined with advanced Machine Learning techniques, in generating coherent and accurate summaries. This study contributes to the development of efficient automated summarization techniques, offering valuable insights for real-time applications and domain-specific content processing.
Περιγραφή
Λέξεις-κλειδιά
Τεχνικές σύνοψης, Σχόλια, Αξιολογήσεις, Επεξεργασία φυσικής γλώσσας, Μεγάλα γλωσσικά μοντέλα, Ταξινόμηση, Summarization techniques, Comments, Reviews, Natural Language Processing (NLP), Large language models, Classification