Συλλογές | |
---|---|
Τίτλος |
Statistical models for natural language processing and topic modelling in R |
Εναλλακτικός τίτλος |
Στατιστικά μοντέλα για επεξεργασία της φυσικής γλώσσας και μοντελοποίηση θεμάτων με χρήση της γλώσσας προγραμματισμού R |
Δημιουργός |
Καβούρ, Ευθύμιος-Ιωάννης, Kavour, Efthimios-Ioannis |
Συντελεστής |
Pedeli, Xanthi Athens University of Economics and Business, Department of Statistics Papageorgiou, Ioulia Papastamoulis, Panagiotis |
Τύπος |
Text |
Φυσική περιγραφή |
78p. |
Γλώσσα |
en |
Αναγνωριστικό |
http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11516 |
Περίληψη |
The aim of this thesis is the in-depth analysis and application of the Latent Dirichlet Allocation (LDA) method, which allows for the categorization of textual data into thematic groups. Initially, a brief introduction to machine learning is provided, followed by a detailed study of the model of interest. Finally, the method is applied to a collection of books, analyzing and grouping of their descriptions. Σκοπός της παρούσας διπλωματικής εργασίας είναι η εις βάθος ανάλυση και εφαρμογή της μεθόδου Latent Dirichlet Allocation (LDA), η οποία επιτρέπει την κατηγοριοποίηση λεκτικών δεδομένων σε θεματικές ομάδες. Αρχικά, παρουσιάζεται μια συνοπτική εισαγωγή στη μηχανική μάθηση, ακολουθούμενη από λεπτομερή μελέτη του μοντέλου ενδιαφέροντος. Τέλος, η μέθοδος εφαρμόζεται σε μια συλλογή βιβλίων, με σκοπό την ανάλυση και κατηγοριοποίηση των περιγραφών τους. |
Λέξη κλειδί |
Μηχανική μάθηση Εξαγωγή δεδομένων από το διαδίκτυο Επεξεργασία φυσικής γλώσσας Machine learning (ML) Web scrapping Latent Dirichlet Allocation (LDA) Natural Language Processing (NLP) Latent semantic analysis |
Διαθέσιμο από |
2024-09-18 18:57:25 |
Ημερομηνία έκδοσης |
17-09-2024 |
Ημερομηνία κατάθεσης |
2024-09-18 18:57:25 |
Δικαιώματα χρήσης |
Free access |
Άδεια χρήσης |
https://creativecommons.org/licenses/by/4.0/ |