Statistical models for natural language processing and topic modelling in R
dc.contributor.degreegrantinginstitution | Athens University of Economics and Business, Department of Statistics | en |
dc.contributor.opponent | Papageorgiou, Ioulia | en |
dc.contributor.opponent | Pedeli, Xanthi | en |
dc.contributor.thesisadvisor | Papastamoulis, Panagiotis | en |
dc.creator | Καβούρ, Ευθύμιος-Ιωάννης | el |
dc.creator | Kavour, Efthimios-Ioannis | en |
dc.date.accessioned | 2025-03-26T19:11:18Z | |
dc.date.available | 2025-03-26T19:11:18Z | |
dc.date.issued | 17-09-2024 | |
dc.date.submitted | 2024-09-18 18:57:25 | |
dc.description.abstract | Σκοπός της παρούσας διπλωματικής εργασίας είναι η εις βάθος ανάλυση και εφαρμογή της μεθόδου Latent Dirichlet Allocation (LDA), η οποία επιτρέπει την κατηγοριοποίηση λεκτικών δεδομένων σε θεματικές ομάδες. Αρχικά, παρουσιάζεται μια συνοπτική εισαγωγή στη μηχανική μάθηση, ακολουθούμενη από λεπτομερή μελέτη του μοντέλου ενδιαφέροντος. Τέλος, η μέθοδος εφαρμόζεται σε μια συλλογή βιβλίων, με σκοπό την ανάλυση και κατηγοριοποίηση των περιγραφών τους. | el |
dc.description.abstract | The aim of this thesis is the in-depth analysis and application of the Latent Dirichlet Allocation (LDA) method, which allows for the categorization of textual data into thematic groups. Initially, a brief introduction to machine learning is provided, followed by a detailed study of the model of interest. Finally, the method is applied to a collection of books, analyzing and grouping of their descriptions. | en |
dc.embargo.expire | 2024-09-18 18:57:25 | |
dc.embargo.rule | Open access | |
dc.format.extent | 78p. | |
dc.identifier | http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11516 | |
dc.identifier.uri | https://pyxida.aueb.gr/handle/123456789/1818 | |
dc.language | en | |
dc.rights | CC BY: Attribution alone 4.0 | |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Εξαγωγή δεδομένων από το διαδίκτυο | el |
dc.subject | Επεξεργασία φυσικής γλώσσας | el |
dc.subject | Machine learning (ML) | en |
dc.subject | Web scrapping | en |
dc.subject | Latent Dirichlet Allocation (LDA) | en |
dc.subject | Natural Language Processing (NLP) | en |
dc.subject | Latent semantic analysis | en |
dc.title | Statistical models for natural language processing and topic modelling in R | en |
dc.title.alternative | Στατιστικά μοντέλα για επεξεργασία της φυσικής γλώσσας και μοντελοποίηση θεμάτων με χρήση της γλώσσας προγραμματισμού R | el |
dc.type | Text |
Αρχεία
Πρωτότυπος φάκελος/πακέτο
1 - 1 από 1