Tuples-DMM: a retrieval-enhanced concept-driven guided decoding algorithm
dc.aueb.department | Department of Informatics | |
dc.contributor.thesisadvisor | Pavlopoulos, Ioannis | en |
dc.creator | Plavos, Dimosthenis | en |
dc.creator | Πλαβός, Δημοσθένης | el |
dc.date.accessioned | 2025-04-14T14:40:51Z | |
dc.date.available | 2025-04-14T14:40:51Z | |
dc.date.issued | 2024-10-25 | |
dc.description.abstract | Η αυτόµατη περιγραφή ιατριϰών ειϰόνων αποτελεί µια εξελισσόµενη διαδιϰασία στον τοµέα της Τεχνητής Νοηµοσύνης που περιλαµβάνει την αυτόµατη παραγωγή περιγραφιϰών λεζαντών για τέτοιες ειϰόνες. Ενισχύεται από τις προόδους στις τεχνολογίες απειϰόνισης ϰαι τον αυξανόµενο αριϑµό ασϑενών, τα οποία έχουν οδηγήσει στη δηµιουργία ενός µεγάλου αριϑµού αϰτινολογιϰών ειϰόνων στις µονάδες υγειονοµιϰής περίϑαλψης παγϰοσµίως. Η ανάλυση αυτών των ειϰόνων απαιτεί σηµαντιϰή ποσότητα χρόνου από τους ϰλινιϰούς ιατρούς, γεγονός που ϰαϑιστά την αυτοµατοποίηση αυτής της διαδιϰασίας ένα µέσο εξοιϰονόµησης χρόνου. Οι αυτόµατα δηµιουργούµενες λεζάντες µπορούν επίσης να χρησιµεύσουν ως εργαλεία για την ϰαϑοδήγηση της διαγνωστιϰής διαδιϰασίας ή την επιβεβαίωση των ευρηµάτων των ϰλινιϰών ιατρών. Η πτυχιαϰή αυτή εργασία επιϰεντρώνεται στην Παραγωγή ∆ιαγνωστιϰής Περιγραφής (Diagnostic Captioning), η οποία αναφέρεται στη δηµιουργία ϰειµενιϰών περιγραφών µε στόχο την αναγνώριση ϰαι µετάδοση διαγνωστιϰών πληροφοριών από ιατριϰές ειϰόνες. Για την υλοποίησή της, χρησιµοποιεί το σύνολο δεδοµένων ImageCLEFmedical 2023. Η προτεινόµενη µέϑοδος TuplesDMM βασίζεται στη µέϑοδο DMM (Distance from Median Maximum), που αποτελεί µια µεϑοδολογία Καϑοδηγούµενης Αποϰωδιϰοποίησης βασισµένη σε"ϰεντριϰές έννοιες" ϰαι παρουσιάστηϰε από τον Kaliosis ϰαι άλλους [Kal+24]. Η µέϑοδος DMM δηµιουργεί περιγραφές ενσωµατώνοντας ρητά ή άρρητα τις έννοιες που σχετίζονται µε µια ιατριϰή ειϰόνα, σύµφωνα µε τον τρόπο που αυτές οι έννοιες εϰπροσωπούνται στα παραδέιγµατα εϰπαίδευσης. Η µέϑοδος Tuples-DMM ϰαι οι τροποποιήσεις της στοχεύουν στην ανάϰτηση των πιο σχετιϰών δεδοµένων εϰπαίδευσης ϰαι την τροποποίηση του αλγορίϑµου DMM. Ο στόχος είναι η βελτίωση της ϰαϑοδηγούµενης δηµιουργίας µέσω της αποφυγής της επιρροής από δεδοµένα εϰπαίδευσης που αντιπροσωπεύουν άσχετα νοηµατιϰά ϑέµατα ϰαι της εστίασης σε σχετιϰά νοηµατιϰά δεδοµένα εϰπαίδευσης, προϰειµένου να επιτευχϑούν πιο αϰριβείς ϰαι νοηµατιϰά ουσιαστιϰές περιγραφές. | el |
dc.description.abstract | Biomedical image captioning is an evolving task in the field of Artificial Intelligence that involves the automatic generation of descriptive captions for medical images. It is driven by the advancements in imaging technologies and the increasing volume of patients that have resulted in a large number of radiological images in healthcare facilities worldwide. Analyzing these images demands a great amount of time from clinicians, which makes the automation of this procedure a time-saving process. The automatically created captions can also serve as tools to guide the diagnosis process or confirm the findings of the clinicians. This thesis focuses on Diagnostic Captioning (DC), which refers to the generation of textual descriptions aimed at identifying and conveying diagnostic information from medical images. For its implementation, it utilizes the ImageCLEFmedical 2023 dataset. The proposed Tuples-DMM method builds upon the DMM (Distance from Median Maximum) approach, which is a key concepts-driven Guided Decoding method introduced by Kal et al. [Kal+24]. DMM method generates captions by explicitly or implicitly incorporating the tags associated with a medical image, based on how these tags are represented in its training captions. Tuples-DMM method and its modifications integrate strategies to retrieve the most relevant training data and modify the DMM algorithm. The goal is to enhance guided generation by minimizing the influence of captions that represent unrelated contexts and focusing on contextually relevant training data to achieve more accurate and meaningful captions. | en |
dc.embargo.rule | Open access | |
dc.format.extent | pages 59 | en |
dc.identifier.uri | https://pyxida.aueb.gr/handle/123456789/11865 | |
dc.language | en | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Natural Language Processing (NLP) | en |
dc.subject | Artificial Intelligence (AI) | en |
dc.subject | Data science | en |
dc.subject | Eπεξεργασία φυσικής γλώσσας | el |
dc.subject | Τεχνητή νοημοσύνη | el |
dc.subject | Επιστήμη δεδομένων | el |
dc.title | Tuples-DMM: a retrieval-enhanced concept-driven guided decoding algorithm | en |
dc.title.alternative | Tuples-DMM: αλγόριθμος σημασιολογικά καθοδηγούμενης αποκωδικοποίησης με ενίσχυση ανάκτησης πληροφορίας | el |
dc.type | Text |
Αρχεία
Πρωτότυπος φάκελος/πακέτο
1 - 1 από 1