Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Α reinforcement learning approach on matrix triangularization using rotations

dc.contributor.degreegrantinginstitutionAthens University of Economics and Business, Department of Statisticsen
dc.contributor.opponentDemiris, Nikolaosen
dc.contributor.opponentLivada, Alexandraen
dc.contributor.thesisadvisorDellaportas, Petrosen
dc.creatorΛώλος, Αλέξανδροςel
dc.creatorLolos, Alexandrosen
dc.date.accessioned2025-03-26T19:07:19Z
dc.date.available2025-03-26T19:07:19Z
dc.date.issued21-11-2023
dc.date.submitted2023-12-11 09:57:30
dc.description.abstractΣε αυτήν τη διπλωματική εργασία θα μελετήσουμε λεπτομερώς τον μετασχηματισμό Householder, τις περιστροφές Givens, τις περιστροφές Cordic Givens, τον αλγόριθμο Gram-Schmidt και την τροποποιημένη έκδοσή του. ́Ολες αυτές οι μέθοδοι στις οποίες αναφερθήκαμε μέχρι στιγμής είναι μέθοδοι για την παραγοντοποίηση QR με διαφορές σε πολυπλοκότητα και σφάλμα. Επίσης θα συζητήσουμε για την βασική θεωρία της ενισχυτικής μάθησης και θα εξερευνήσουμε τις διαφορές μεταξύ αλγορίθμων όπως ο SARSA και ο Q-Learning. Στο κεφάλαιο των πειραματισμών θα σχεδιάσουμε την παραγοντοποίηση QR σαν ένα επιτραπέζιο. Με τη χρήση ενισχυτικής μάθησης και συγκεκριμένα του Q-Learning αλγορίθμου θα οδηγήσουμε τις περιστροφές Givens σε εναλλακτικά μονοπάτια για τον αλγόριθμό μας, όπου για συγκεκριμένες εισόδους πινάκων θα οδηγηθούν στη παραγοντοποίηση QR σε λιγότερες επαναλήψεις.el
dc.description.abstractIn this thesis, we will discuss in detail about Householder transformation, Givens rotations, Cordic Givens rotations and Gram-Schmidt, along with its modified variant. All of the mentioned methods are QR decomposition methods with differences in complexity and error. Furthermore, we will discuss about the basic theory of Reinforcement Learning and explore the differences between algorithms such as SARSA and Q-Learning. In the experimentation section we will design the QR decomposition as a board game. With the use of Reinforcement Learning and specifically the Q-Learning algorithm we will guide the Givens rotation into alternative paths for our algorithms, that in specific matrix input cases can reach the QR decomposition state in less iterations.en
dc.embargo.expire2023-12-11 09:57:30
dc.embargo.ruleOpen access
dc.format.extent50p.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10914
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/1157
dc.languageen
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectΠεριστροφή Givensel
dc.subjectΠαραγοντοποίηση QRel
dc.subjectΕνισχυτική μάθησηel
dc.subjectGivens rotationen
dc.subjectQR decompositionen
dc.subjectReinforcement learningen
dc.titleΑ reinforcement learning approach on matrix triangularization using rotationsen
dc.title.alternativeΠροσέγγιση της τριγωνοποίησης πινάκων μέσω περιστροφών με την χρήση ενισχυτικής μάθησηςel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Lolos_2023.pdf
Μέγεθος:
1.35 MB
Μορφότυπο:
Adobe Portable Document Format