Finetuning of open source LLMs for specific domains
Ημερομηνία
07-03-2024
Συγγραφείς
Stavropoulos, Christos
Σταυρόπουλος, Χρήστος
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Επιβλέπων
Διαθέσιμο από
2024-03-17 15:18:37
Περίληψη
Τα μεγάλα γλωσσικά μοντέλα επιδεικνύουν εξαιρετικές δυνατότητες στην κατανόηση της γλώσσας, παρουσιάζοντας υψηλές επιδόσεις σε διάφορες εργασίες επεξεργασίας φυσικής γλώσσας. Ωστόσο, η απόδοσή τους συχνά μειώνεται σε εξειδικευμένους τομείς, όπως το δίκαιο, η υγειονομική περίθαλψη και τα οικονομικά, λόγω της εξειδικευμένης ορολογίας και της σύνθετης χρήσης της γλώσσας σε αυτούς τους τομείς. Η απόδοσή τους μπορεί να βελτιωθεί περαιτέρω προσαρμόζοντας αυτά τα μοντέλα σε συγκεκριμένους τομείς ή εργασίες μέσω μιας διαδικασίας που ονομάζεται finetuning. Στη παρούσα διπλωματική θα ερευνήσουμε την δυνατότητα αναπαραγωγής προσαρμοσμένων μοντέλων στα χρηματοοικονομικά, διερευνάμε επίσης πιθανές βελτιώσεις και αξιολογούμε την αποτελεσματικότητα της προσαρμογής. Τέλος θα εξετάσουμε τις δυνατότητες προσαρμογής στον τομέα του Ανθρώπινου Δυναμικού.Large Language Models (LLMs) demonstrate remarkable capabilities in general language understanding exhibiting great performance in various natural language processing (NLP) tasks. Yet, their performance may face difficulties in specialized domains like law, healthcare and finance. This is a cause of specialized language and intricate terminologies found in these domains. Finetuning, a technique used to tailor LLMs to specific tasks, plays a crucial role in successfully adapting LLMs for specialized domains. This thesis investigates finetuning and efficient finetuning techniques. We will also investigate the replicability of the FinGPT methodology, explore potential enhancements, and evaluate the effectiveness of finetuning for domain-specific LLM development. Lastly, the potential of finetuning LLMs for Human Resources will be investigated.
Περιγραφή
Λέξεις-κλειδιά
Μεγάλα γλωσσικά μοντέλα, Προσαρμογή, Τεχνητή νοημοσύνη, Large language models, Finetuning, Artificial Intelligence (AI)