2025-03-262025-03-2617-09-20242024-09-18https://pyxida.aueb.gr/handle/123456789/1818Σκοπός της παρούσας διπλωματικής εργασίας είναι η εις βάθος ανάλυση και εφαρμογή της μεθόδου Latent Dirichlet Allocation (LDA), η οποία επιτρέπει την κατηγοριοποίηση λεκτικών δεδομένων σε θεματικές ομάδες. Αρχικά, παρουσιάζεται μια συνοπτική εισαγωγή στη μηχανική μάθηση, ακολουθούμενη από λεπτομερή μελέτη του μοντέλου ενδιαφέροντος. Τέλος, η μέθοδος εφαρμόζεται σε μια συλλογή βιβλίων, με σκοπό την ανάλυση και κατηγοριοποίηση των περιγραφών τους.The aim of this thesis is the in-depth analysis and application of the Latent Dirichlet Allocation (LDA) method, which allows for the categorization of textual data into thematic groups. Initially, a brief introduction to machine learning is provided, followed by a detailed study of the model of interest. Finally, the method is applied to a collection of books, analyzing and grouping of their descriptions.78p.CC BY: Attribution alone 4.0https://creativecommons.org/licenses/by/4.0/Μηχανική μάθησηΕξαγωγή δεδομένων από το διαδίκτυοΕπεξεργασία φυσικής γλώσσαςMachine learning (ML)Web scrappingLatent Dirichlet Allocation (LDA)Natural Language Processing (NLP)Latent semantic analysisStatistical models for natural language processing and topic modelling in RΣτατιστικά μοντέλα για επεξεργασία της φυσικής γλώσσας και μοντελοποίηση θεμάτων με χρήση της γλώσσας προγραμματισμού RText