PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Capturing temporal patterns in deliberations and discussions
Alternative Title :Ανίχνευση μοτίβων σε διαβουλεύσεις και συζητήσεις
Creator :Μπαλής, Ραφαήλ
Mpalis, Rafail
Contributor :Pavlopoulos, Ioannis (Επιβλέπων καθηγητής)
Stafylakis, Themos (Εξεταστής)
Vassalos, Vasilios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Type :Text
Extent :66p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11758
Abstract :Η παρούσα διπλωματική εργασία διερευνά καινοτόμες προσεγγίσεις για τη σύνοψη και την απεικόνιση σχολίων (αναρτήσεων) από διαδικτυακές συζητήσεις και αξιολογήσεις, χρησιμοποιώντας έναν συνδυασμό παραδοσιακών μεθόδων μηχανικής μάθησης και Μεγάλων Γλωσσικών Μοντέλων γνωστά και ως “LLMs”. Η έρευνα επικεντρώνεται σε μεθόδους που περιλαμβάνουν ομαδοποίηση βάσει χρονικής σήμανσης, συσταδοποίηση, εξαγωγή θεμάτων και σύνοψη βάσει ετικετών (labeling), με στόχο τη βελτίωση της επεξεργασίας διαδικτυακών συζητήσεων ή σχολίων χρηστών. Εφαρμόζοντας αυτές τις μεθόδους σε διάφορα σύνολα δεδομένων, αξιολογούμε την απόδοσή τους χρησιμοποιώντας μετρικές όπως BLEU, ROUGE και BERTscore. Τα αποτελέσματα καταδεικνύουν την αποτελεσματικότητα των μοντέλων “Transformer”, ιδιαίτερα όταν συνδυάζονται με προηγμένες τεχνικές Μηχανικής Μάθησης, στη δημιουργία συνεκτικών και ακριβών συνοψίσεων. Η μελέτη αυτή συμβάλλει στην ανάπτυξη αποδοτικών αυτοματοποιημένων τεχνικών σύνοψης, προσφέροντας πολύτιμες γνώσεις για εφαρμογές σε πραγματικό χρόνο και επεξεργασία περιεχομένου συγκεκριμένων τομέων.
This thesis investigates innovative approaches for summarizing and visualizing comments (post) from online discussions and reviews using a combination of traditional machine learning methods and state-of-the-art Large Language Models (LLMs). The research focuses on methods consisting of grouping by timestamp, clustering, topic extraction, and label-based summarization to enhance the processing of online discussions or user-generated reviews. By applying these methods to various datasets, we evaluate their performance using metrics such as BLEU, ROUGE, and BERTscore. The results demonstrate the effectiveness of Transformer-based models, particularly when combined with advanced Machine Learning techniques, in generating coherent and accurate summaries. This study contributes to the development of efficient automated summarization techniques, offering valuable insights for real-time applications and domain-specific content processing.
Subject :Τεχνικές σύνοψης
Σχόλια
Αξιολογήσεις
Επεξεργασία φυσικής γλώσσας
Μεγάλα γλωσσικά μοντέλα
Ταξινόμηση
Summarization techniques
Comments
Reviews
Natural Language Processing (NLP)
Large language models
Classification
Date Available :2024-12-05 00:13:34
Date Issued :26-11-2024
Date Submitted :2024-12-05 00:13:34
Access Rights :Free access
Licence :

File: Mpalis_2024.pdf

Type: application/pdf