Συλλογές
Τίτλος Blue collar-white collar job classification
Εναλλακτικός τίτλος Κατηγοριοποίηση αγγελιών με βάση το χρώμα του κολάρου
Δημιουργός Τσουκάρα, Αλεξία, Tsoukara, Alexia
Συντελεστής Athens University of Economics and Business, Department of Informatics
Κωτίδης, Ιωάννης
Βασσάλος, Βασίλειος
Τύπος Text
Φυσική περιγραφή 56p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=7486
Περίληψη In this thesis we experiment with machine learning and deep learning models for two binary classification tasks. The experiments were performed on a dataset, provided by Workable, which contains job postings. Our main goal is to classify the job postings according to their collar color and level of requirements. First, we set the baseline usingthe machine learning algorithm XGBoost and we prove that extracting information from data that have not been annotated, leads to impressive results. Then by using deep learning architectures, which include variations of CNN and RNN models, we surpass our baseline. Finally we experiment with BERT, a model that achieves state-of-the-art results on various tasks, and we show how it performs on Workable’s dataset.
Στην παρούσα διπλωματική εργασία έγιναν πειραματισμοί με μοντέλα μηχανικής μάθησης (machine learning) και μοντέλα βαθιάς μάθησης (deep learning) για δύο προβλήματα κατηγοριοποίησης. Τα πειράματα διεξήχθησαν σε ένα σύνολο δεδομένων, που μας παρείχε η Workable, τα οποία περιέχουν αγγελίες εταιρειών. Ο βασικός μας στόχος είναι να κατηγοριοποιήσουμε τις αγγελίες με βάση το χρώμα του κολάρου (collar color) και με τις απαιτήσεις της εργασίας. Πρώτα ορίσαμε ως βάση τον αλγόριθμο μηχανικής μάθησης XGBoost και αποδείξαμε ότι αντλώντας πληροφορία από τα δεδομένα στα οποία δεν έχει γίνει επισημείωση, οδηγούμαστε σε εντυπωσιακά αποτελέσματα. Χρησιμοποιώντας αρχιτεκτονικές βαθιάς μάθησης, οι οποίες περιλαμβάνουν ποικίλες προσεγγίσεις των Συνελικτικών Νευρωνικών Δικτύων (CNNs) και των Ανατροφοδοτούμενων Νευρωνικών Δικτύων (RNNs) ξεπεράσαμε την καλύτερη μας τεχνολογία. Τέλος, χρησιμοποιούμε το μοντέλο BERT και παραθέτουμε τα αποτελέσματα των πειραμάτων στο σύνολο των δεδομένων της Workable.
Λέξη κλειδί Collar color
Deep learning
Natural Language Processing (NLP)
BERT
Αγγελία εργασίας
Χρώμα κολάρου
Βαθιά μάθηση
Επεξεργασία φυσικής γλώσσας
Job classification
Διαθέσιμο από 2020-01-27 17:17:41
Ημερομηνία έκδοσης 2019
Ημερομηνία κατάθεσης 2020-01-27 17:17:41
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/