Εντοπίστηκε ένα σφάλμα στη λειτουργία της ΠΥΞΙΔΑΣ όταν χρησιμοποιείται μέσω του προγράμματος περιήγησης Safari. Μέχρι να αποκατασταθεί το πρόβλημα, προτείνουμε τη χρήση εναλλακτικού browser όπως ο Chrome ή ο Firefox. A bug has been identified in the operation of the PYXIDA platform when accessed via the Safari browser. Until the problem is resolved, we recommend using an alternative browser such as Chrome or Firefox.
 

Statistical models for natural language processing and topic modelling in R

dc.contributor.degreegrantinginstitutionAthens University of Economics and Business, Department of Statisticsen
dc.contributor.opponentPapageorgiou, Iouliaen
dc.contributor.opponentPedeli, Xanthien
dc.contributor.thesisadvisorPapastamoulis, Panagiotisen
dc.creatorΚαβούρ, Ευθύμιος-Ιωάννηςel
dc.creatorKavour, Efthimios-Ioannisen
dc.date.accessioned2025-03-26T19:11:18Z
dc.date.available2025-03-26T19:11:18Z
dc.date.issued17-09-2024
dc.date.submitted2024-09-18 18:57:25
dc.description.abstractΣκοπός της παρούσας διπλωματικής εργασίας είναι η εις βάθος ανάλυση και εφαρμογή της μεθόδου Latent Dirichlet Allocation (LDA), η οποία επιτρέπει την κατηγοριοποίηση λεκτικών δεδομένων σε θεματικές ομάδες. Αρχικά, παρουσιάζεται μια συνοπτική εισαγωγή στη μηχανική μάθηση, ακολουθούμενη από λεπτομερή μελέτη του μοντέλου ενδιαφέροντος. Τέλος, η μέθοδος εφαρμόζεται σε μια συλλογή βιβλίων, με σκοπό την ανάλυση και κατηγοριοποίηση των περιγραφών τους.el
dc.description.abstractThe aim of this thesis is the in-depth analysis and application of the Latent Dirichlet Allocation (LDA) method, which allows for the categorization of textual data into thematic groups. Initially, a brief introduction to machine learning is provided, followed by a detailed study of the model of interest. Finally, the method is applied to a collection of books, analyzing and grouping of their descriptions.en
dc.embargo.expire2024-09-18 18:57:25
dc.embargo.ruleOpen access
dc.format.extent78p.
dc.identifierhttp://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11516
dc.identifier.urihttps://pyxida.aueb.gr/handle/123456789/1818
dc.languageen
dc.rightsCC BY: Attribution alone 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectΜηχανική μάθησηel
dc.subjectΕξαγωγή δεδομένων από το διαδίκτυοel
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.subjectMachine learning (ML)en
dc.subjectWeb scrappingen
dc.subjectLatent Dirichlet Allocation (LDA)en
dc.subjectNatural Language Processing (NLP)en
dc.subjectLatent semantic analysisen
dc.titleStatistical models for natural language processing and topic modelling in Ren
dc.title.alternativeΣτατιστικά μοντέλα για επεξεργασία της φυσικής γλώσσας και μοντελοποίηση θεμάτων με χρήση της γλώσσας προγραμματισμού Rel
dc.typeText

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Τώρα δείχνει 1 - 1 από 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Kavour_2024.pdf
Μέγεθος:
2.5 MB
Μορφότυπο:
Adobe Portable Document Format