Investigating hallucinations in AI-based text generation using semantic entropy

Αγγελίδης, Αναστάσιος; Angelidis, Anastasios

Investigating hallucinations in AI-based text generation using semantic entropy

dc.contributor.degreegrantinginstitution	Athens University of Economics and Business, Department of Informatics	en
dc.contributor.opponent	Toumpis, Stavros	en
dc.contributor.opponent	Pavlopoulos, Ioannis	en
dc.contributor.thesisadvisor	Koutsopoulos, Iordanis	en
dc.creator	Αγγελίδης, Αναστάσιος	el
dc.creator	Angelidis, Anastasios	en
dc.date.accessioned	2025-02-16	*
dc.date.available	2025-03-26T19:14:09Z
dc.date.issued	2025-02-07	*
dc.date.issuedoriginal	07-02-2025	*
dc.date.submitted	2025-02-16 22:48:20
dc.description.abstract	Τα Μεγάλα Γλωσσικά Μοντέλα (LLMs) έχουν φέρει επανάσταση στη Γενετική Φυσικής Γλώσσας (NLG), αλλά πάσχουν από παραισθήσεις—παραγόμενο περιεχόμενο που είναι πραγματολογικά λανθασμένο ή μη πιστό στο αρχικό υλικό. Αυτή η διπλωματική εργασία διερευνά τις επινοήσεις, μια συγκεκριμένη υποκατηγορία παραισθήσεων, χρησιμοποιώντας ένα πλαίσιο σημασιολογικής εντροπίας. Μέσω ομαδοποίησης σημασιολογικά ισοδύναμων απαντήσεων και υπολογισμού της εντροπίας, το πλαίσιο εντοπίζει αβέβαιες εξόδους που είναι πιθανό να αποτελούν επινοήσεις. Μια βασική τροποποίηση αντικαθιστά την υπολογιστικά απαιτητική αξιολόγηση σημασιολογικά ισοδύναμων απαντήσεων με LLMs με ελαφριά μοντέλα Transformer, προσαρμοσμένα για Συμπερασματική Φυσικής Γλώσσας (NLI). Τα πειραματικά αποτελέσματα σε σύνολα δεδομένων αξιολόγησης (TriviaQA, SQuAD, SVAMP και NQ Open) δείχνουν βελτιωμένη ακρίβεια, κλιμάκωση και αποδοτικότητα.	el
dc.description.abstract	Large Language Models (LLMs) have revolutionized Natural Language Generation (NLG) but suffer from hallucinations—generated content that is factually incorrect or unfaithful to source material. This thesis investigates confabulations, a specific subset of hallucinations, using a semantic entropy framework. By clustering semantically equivalent responses and computing entropy, the framework identifies uncertain outputs likely to be confabulations. A key modification replaces computationally intensive LLM-based entailment evaluation with lightweight Transformer models fine-tuned for Natural Language Inference (NLI). Experimental results on benchmark datasets (TriviaQA, SQuAD, SVAMP, and NQ Open) demonstrate improved accuracy, scalability, and efficiency.	en
dc.embargo.expire	2025-02-16 22:48:20
dc.embargo.rule	Open access
dc.format.extent	82p.
dc.identifier	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11894
dc.identifier.uri	https://pyxida.aueb.gr/handle/123456789/2236
dc.identifier.uri	https://doi.org/10.26219/heal.aueb.5098
dc.language	en
dc.rights	CC BY-NC: Attribution + Noncommercial 4.0
dc.rights.uri	https://creativecommons.org/licenses/by-nc/4.0/
dc.subject	Παραισθήσεις	el
dc.subject	Μεγάλα γλωσσικά μοντέλα	el
dc.subject	Μετασχηματιστής	el
dc.subject	Συνεπακόλουθο	el
dc.subject	Hallucinations	en
dc.subject	Large Language Model (LLM)	en
dc.subject	Transformer	en
dc.subject	Entailment	en
dc.title	Investigating hallucinations in AI-based text generation using semantic entropy	en
dc.title.alternative	Διερεύνηση παραισθήσεων στην παραγωγή κειμένου με τεχνητή νοημοσύνη μέσω σημασιολογικής εντροπίας	el
dc.type	Text

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1

Ονομα:: Angelidis_2025.pdf
Μέγεθος:: 2.78 MB
Μορφότυπο:: Adobe Portable Document Format

Κατεβάστε

Συλλογές

Τμήμα Πληροφορικής

Μεταπτυχιακές Εργασίες