Finetuning of open source LLMs for specific domains

Stavropoulos, Christos; Σταυρόπουλος, Χρήστος

Finetuning of open source LLMs for specific domains

Αρχεία

Stavropoulos_2024.pdf (1.77 MB)

Ημερομηνία

2024-03-07

Συγγραφείς

Stavropoulos, Christos
Σταυρόπουλος, Χρήστος

Επιβλέποντα

Vassalos, Vasilios

Διαθέσιμο από

2024-03-17 15:18:37

Περίληψη

Τα μεγάλα γλωσσικά μοντέλα επιδεικνύουν εξαιρετικές δυνατότητες στην κατανόηση της γλώσσας, παρουσιάζοντας υψηλές επιδόσεις σε διάφορες εργασίες επεξεργασίας φυσικής γλώσσας. Ωστόσο, η απόδοσή τους συχνά μειώνεται σε εξειδικευμένους τομείς, όπως το δίκαιο, η υγειονομική περίθαλψη και τα οικονομικά, λόγω της εξειδικευμένης ορολογίας και της σύνθετης χρήσης της γλώσσας σε αυτούς τους τομείς. Η απόδοσή τους μπορεί να βελτιωθεί περαιτέρω προσαρμόζοντας αυτά τα μοντέλα σε συγκεκριμένους τομείς ή εργασίες μέσω μιας διαδικασίας που ονομάζεται finetuning. Στη παρούσα διπλωματική θα ερευνήσουμε την δυνατότητα αναπαραγωγής προσαρμοσμένων μοντέλων στα χρηματοοικονομικά, διερευνάμε επίσης πιθανές βελτιώσεις και αξιολογούμε την αποτελεσματικότητα της προσαρμογής. Τέλος θα εξετάσουμε τις δυνατότητες προσαρμογής στον τομέα του Ανθρώπινου Δυναμικού.

Large Language Models (LLMs) demonstrate remarkable capabilities in general language understanding exhibiting great performance in various natural language processing (NLP) tasks. Yet, their performance may face difficulties in specialized domains like law, healthcare and finance. This is a cause of specialized language and intricate terminologies found in these domains. Finetuning, a technique used to tailor LLMs to specific tasks, plays a crucial role in successfully adapting LLMs for specialized domains. This thesis investigates finetuning and efficient finetuning techniques. We will also investigate the replicability of the FinGPT methodology, explore potential enhancements, and evaluate the effectiveness of finetuning for domain-specific LLM development. Lastly, the potential of finetuning LLMs for Human Resources will be investigated.