Συλλογές
Τίτλος Statistical models for natural language processing and topic modelling in R
Εναλλακτικός τίτλος Στατιστικά μοντέλα για επεξεργασία της φυσικής γλώσσας και μοντελοποίηση θεμάτων με χρήση της γλώσσας προγραμματισμού R
Δημιουργός Καβούρ, Ευθύμιος-Ιωάννης, Kavour, Efthimios-Ioannis
Συντελεστής Pedeli, Xanthi
Athens University of Economics and Business, Department of Statistics
Papageorgiou, Ioulia
Papastamoulis, Panagiotis
Τύπος Text
Φυσική περιγραφή 78p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11516
Περίληψη The aim of this thesis is the in-depth analysis and application of the Latent Dirichlet Allocation (LDA) method, which allows for the categorization of textual data into thematic groups. Initially, a brief introduction to machine learning is provided, followed by a detailed study of the model of interest. Finally, the method is applied to a collection of books, analyzing and grouping of their descriptions.
Σκοπός της παρούσας διπλωματικής εργασίας είναι η εις βάθος ανάλυση και εφαρμογή της μεθόδου Latent Dirichlet Allocation (LDA), η οποία επιτρέπει την κατηγοριοποίηση λεκτικών δεδομένων σε θεματικές ομάδες. Αρχικά, παρουσιάζεται μια συνοπτική εισαγωγή στη μηχανική μάθηση, ακολουθούμενη από λεπτομερή μελέτη του μοντέλου ενδιαφέροντος. Τέλος, η μέθοδος εφαρμόζεται σε μια συλλογή βιβλίων, με σκοπό την ανάλυση και κατηγοριοποίηση των περιγραφών τους.
Λέξη κλειδί Μηχανική μάθηση
Εξαγωγή δεδομένων από το διαδίκτυο
Επεξεργασία φυσικής γλώσσας
Machine learning (ML)
Web scrapping
Latent Dirichlet Allocation (LDA)
Natural Language Processing (NLP)
Latent semantic analysis
Διαθέσιμο από 2024-09-18 18:57:25
Ημερομηνία έκδοσης 17-09-2024
Ημερομηνία κατάθεσης 2024-09-18 18:57:25
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/