Πλοήγηση ανά Επιβλέποντα "Sgouritsa, Alkmini"
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Τώρα δείχνει 1 - 1 από 1
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Extrapolate equilibria and strategic behavior using LLMs(2025-05-29) Bekiaris, Ioannis; Markakis, Evangelos; Dimakis, Antonios; Sgouritsa, AlkminiΗ ϑεωρία παιγνίων είναι η µελέτη µαϑηµατιϰών µοντέλων που αντιπροσωπεύουν στρατηγιϰές αλληλεπιδράσεις µεταξύ ορϑολογιϰών παραγόντων, όπου ϰάϑε πράϰτορας στοχεύει να µεγιστοποιήσει την απόδοσή του ενώ προβλέπει τις ενέργειες των άλλων. αραδοσιαϰά, αυτά τα µοντέλα βασίζονται σε ντετερµινιστιϰά ορισµένες στρατηγιϰές ϰαι αποδόσεις. Ωστόσο, τα τελευταία χρόνια, η εµφάνιση των Μεγάλων Γλωσσιϰών Μοντέλων (LLM) άνοιξε την πόρτα στη διερεύνηση εάν αυτά τα συστήµατα τεχνητής νοηµοσύνης µπορούν να συµµετάσχουν στη λήψη στρατηγιϰών αποφάσεων σε περιβάλλοντα πολλαπλών παραγόντων, ειδιϰά στην προσέγγιση του Nash Equilibrium (NE), όπου πρόϰειται για µια απο τη σηµαντιϰότερη έννοια στη ϑεωρία παιγνίων, όπου ϰανένας παίϰτης δεν µπορεί να βελτιώσει το αποτέλεσµά του αλλάζοντας µονοµερώς τη στρατηγιϰή του. Αυτή η διατριβή διερευνά την ιϰανότητα των LLM να προσεγγίζουν τις στρατηγιϰές ισορροπίας ϰαι να αλληλεπιδρούν µέσω επαναλαµβανόµενων στρατηγιϰών συλλογισµών σε διάφορα περιβάλλοντα ϑεωρίας παιγνίων. Αναπτύσσουµε ένα πλαίσιο στο οποίο δύο LLM instances ανταγωνίζονται σε ένα παιχνίδι µηδενιϰού αϑροίσµατος, που αποτελείται από µια σειρά από γύρους, υπό διαφορετιϰές δοµές ϰαι συνϑήϰες πληροφοριών. Οι πειραµατιϰές ρυϑµίσεις εξερευνούν σενάρια όπου οι πράϰτορες δεν γνωρίζουν τις προηγούµενες στρατηγιϰές του αντιπάλου τους, το µεριϰό ιστοριϰό (που αντιπροσωπεύει online learning), τη συµπεριφορά που βασίζεται σε πρόσωπα ϰαι τις συµβουλές εξωτεριϰών ειδιϰών, επιτρέποντάς µας να αναλύσουµε πώς οι πληροφορίες ϰαι η ϰαϑοδήγηση επηρεάζουν τη σύγϰλιση της ϰατανοµής. Η ανάλυσή µας επιϰεντρώνεται στην ιϰανότητα των LLM να συγϰλίνουν προς µιϰτές στρατηγιϰές ισορροπίας Nash, να προσαρµοστούν στις συµπεριφορές των αντιπάλων ϰαι να επιδειϰνύουν συλλογιστιϰά µοτίβα που ευϑυγραµµίζονται µε αλγορίϑµους της ϑεωρίας παιγνίων. Μετράµε την απόδοσή τους χρησιµοποιώντας µετριϰές ϰατανοµών όπως η KL divergence από τη ϑεωρητιϰή ϰατανοµή NE σε σχέση την πειραµατιϰή ϰατανοµή των αποτελεσµάτων. Η παρούσα διατριβή συνεισφέρει εξερευνόντας νέες δυνατότητες για την ϰατανόηση της εφαρµογής των LLM σε παιγνιο-ϑεωρητιϰά πλαίσια ϰαι εγείρουν ενδιαφέροντα ερωτήµατα σχετιϰά µε τον πιϑανό ρόλο τους στην επίλυση σύνϑετων, NP-complete προβληµάτων.