AUEB Library - Digital Repository

PYXIDA Institutional Repository
and Digital Library

Username
Password

Collections :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Πληροφορικής / Department of Informatics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Title :	Capturing temporal patterns in deliberations and discussions

Alternative Title :	Ανίχνευση μοτίβων σε διαβουλεύσεις και συζητήσεις

Creator :	Μπαλής, Ραφαήλ Mpalis, Rafail

Contributor :	Pavlopoulos, Ioannis (Επιβλέπων καθηγητής) Stafylakis, Themos (Εξεταστής) Vassalos, Vasilios (Εξεταστής) Athens University of Economics and Business, Department of Informatics (Degree granting institution)

Type :	Text

Extent :	66p.

Language :	en

Identifier :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11758

Abstract :	Η παρούσα διπλωματική εργασία διερευνά καινοτόμες προσεγγίσεις για τη σύνοψη και την απεικόνιση σχολίων (αναρτήσεων) από διαδικτυακές συζητήσεις και αξιολογήσεις, χρησιμοποιώντας έναν συνδυασμό παραδοσιακών μεθόδων μηχανικής μάθησης και Μεγάλων Γλωσσικών Μοντέλων γνωστά και ως “LLMs”. Η έρευνα επικεντρώνεται σε μεθόδους που περιλαμβάνουν ομαδοποίηση βάσει χρονικής σήμανσης, συσταδοποίηση, εξαγωγή θεμάτων και σύνοψη βάσει ετικετών (labeling), με στόχο τη βελτίωση της επεξεργασίας διαδικτυακών συζητήσεων ή σχολίων χρηστών. Εφαρμόζοντας αυτές τις μεθόδους σε διάφορα σύνολα δεδομένων, αξιολογούμε την απόδοσή τους χρησιμοποιώντας μετρικές όπως BLEU, ROUGE και BERTscore. Τα αποτελέσματα καταδεικνύουν την αποτελεσματικότητα των μοντέλων “Transformer”, ιδιαίτερα όταν συνδυάζονται με προηγμένες τεχνικές Μηχανικής Μάθησης, στη δημιουργία συνεκτικών και ακριβών συνοψίσεων. Η μελέτη αυτή συμβάλλει στην ανάπτυξη αποδοτικών αυτοματοποιημένων τεχνικών σύνοψης, προσφέροντας πολύτιμες γνώσεις για εφαρμογές σε πραγματικό χρόνο και επεξεργασία περιεχομένου συγκεκριμένων τομέων. This thesis investigates innovative approaches for summarizing and visualizing comments (post) from online discussions and reviews using a combination of traditional machine learning methods and state-of-the-art Large Language Models (LLMs). The research focuses on methods consisting of grouping by timestamp, clustering, topic extraction, and label-based summarization to enhance the processing of online discussions or user-generated reviews. By applying these methods to various datasets, we evaluate their performance using metrics such as BLEU, ROUGE, and BERTscore. The results demonstrate the effectiveness of Transformer-based models, particularly when combined with advanced Machine Learning techniques, in generating coherent and accurate summaries. This study contributes to the development of efficient automated summarization techniques, offering valuable insights for real-time applications and domain-specific content processing.

Abstract :

Η παρούσα διπλωματική εργασία διερευνά καινοτόμες προσεγγίσεις για τη σύνοψη και την απεικόνιση σχολίων (αναρτήσεων) από διαδικτυακές συζητήσεις και αξιολογήσεις, χρησιμοποιώντας έναν συνδυασμό παραδοσιακών μεθόδων μηχανικής μάθησης και Μεγάλων Γλωσσικών Μοντέλων γνωστά και ως “LLMs”. Η έρευνα επικεντρώνεται σε μεθόδους που περιλαμβάνουν ομαδοποίηση βάσει χρονικής σήμανσης, συσταδοποίηση, εξαγωγή θεμάτων και σύνοψη βάσει ετικετών (labeling), με στόχο τη βελτίωση της επεξεργασίας διαδικτυακών συζητήσεων ή σχολίων χρηστών. Εφαρμόζοντας αυτές τις μεθόδους σε διάφορα σύνολα δεδομένων, αξιολογούμε την απόδοσή τους χρησιμοποιώντας μετρικές όπως BLEU, ROUGE και BERTscore. Τα αποτελέσματα καταδεικνύουν την αποτελεσματικότητα των μοντέλων “Transformer”, ιδιαίτερα όταν συνδυάζονται με προηγμένες τεχνικές Μηχανικής Μάθησης, στη δημιουργία συνεκτικών και ακριβών συνοψίσεων. Η μελέτη αυτή συμβάλλει στην ανάπτυξη αποδοτικών αυτοματοποιημένων τεχνικών σύνοψης, προσφέροντας πολύτιμες γνώσεις για εφαρμογές σε πραγματικό χρόνο και επεξεργασία περιεχομένου συγκεκριμένων τομέων.
This thesis investigates innovative approaches for summarizing and visualizing comments (post) from online discussions and reviews using a combination of traditional machine learning methods and state-of-the-art Large Language Models (LLMs). The research focuses on methods consisting of grouping by timestamp, clustering, topic extraction, and label-based summarization to enhance the processing of online discussions or user-generated reviews. By applying these methods to various datasets, we evaluate their performance using metrics such as BLEU, ROUGE, and BERTscore. The results demonstrate the effectiveness of Transformer-based models, particularly when combined with advanced Machine Learning techniques, in generating coherent and accurate summaries. This study contributes to the development of efficient automated summarization techniques, offering valuable insights for real-time applications and domain-specific content processing.

Subject :	Τεχνικές σύνοψης Σχόλια Αξιολογήσεις Επεξεργασία φυσικής γλώσσας Μεγάλα γλωσσικά μοντέλα Ταξινόμηση Summarization techniques Comments Reviews Natural Language Processing (NLP) Large language models Classification

Date Available :	2024-12-05 00:13:34

Date Issued :	26-11-2024

Date Submitted :	2024-12-05 00:13:34

Access Rights :	Free access

Licence :

File: Mpalis_2024.pdf

Type: application/pdf

Login