Πλοήγηση ανά Επιβλέποντα "Papastefanatos, George"

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω

Τώρα δείχνει 1 - 1 από 1

Prompt caching techniques for optimizing large language models
(2025-07-15) Λύσσας, Χρήστος; Lyssas, Christos; Chatziantoniou, Damianos; Terrovitis, Emmanouil; Papastefanatos, George
Αυτή η διπλωματική εργασία διερευνά τις τεχνικές προσωρινής αποθήκευσης προτροπών (prompt caching) ως μέθοδο για τη βελτιστοποίηση μεγάλων γλωσσικών μοντέλων (LLMs), τα οποία έχουν γίνει όλο και πιο διαδεδομένα σε εργασίες επεξεργασίας φυσικής γλώσσας. Παρά τις εντυπωσιακές τους δυνατότητες, τα LLMs συχνά αντιμετωπίζουν προκλήσεις που σχετίζονται με την υπολογιστική αποδοτικότητα και την καθυστέρηση απόκρισης, ιδιαίτερα σε εφαρμογές πραγματικού χρόνου. Η παρούσα έρευνα προτείνει ένα πλαίσιο για την υλοποίηση της προσωρινής αποθήκευσης προτροπών, το οποίο περιλαμβάνει την αποθήκευση προηγούμενων προτροπών και των αντίστοιχων εξόδων τους, με στόχο την ελαχιστοποίηση περιττών υπολογισμών και τη βελτίωση του χρόνου απόκρισης. Διενεργώ μια εκτενή βιβλιογραφική ανασκόπηση για να τοποθετήσω τη δουλειά μου στο ευρύτερο πλαίσιο της υπάρχουσας έρευνας, επισημαίνοντας σχετικές μελέτες που αφορούν τεχνικές βελτιστοποίησης για LLMs. Τα ευρήματά μου αποκαλύπτουν ότι η προσωρινή αποθήκευση προτροπών μπορεί να ενισχύσει σημαντικά τόσο την αποδοτικότητα όσο και τη χρηστικότητα των LLMs, ανοίγοντας τον δρόμο για ευρύτερη εφαρμογή τους. Η εργασία αυτή συμβάλλει στον επιστημονικό τομέα παρέχοντας μια λεπτομερή ανάλυση των στρατηγικών προσωρινής αποθήκευσης προτροπών και των επιπτώσεών τους στην απόδοση των LLMs, μαζί με μια συζήτηση άλλων τεχνικών βελτιστοποίησης που μπορούν να συμπληρώσουν την προσέγγιση αυτή.