Συλλογές
Τίτλος Finetuning of open source LLMs for specific domains
Εναλλακτικός τίτλος Προσαρμογή μεγάλων γλωσσικών μοντέλων σε εξειδικευμένους τομείς
Δημιουργός Stavropoulos, Christos, Σταυρόπουλος, Χρήστος
Συντελεστής Vrontos, Ioannis
Androutsopoulos, Ion
Athens University of Economics and Business, Department of Informatics
Vassalos, Vasilios
Τύπος Text
Φυσική περιγραφή 45p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11092
Περίληψη Large Language Models (LLMs) demonstrate remarkable capabilities in general language understanding exhibiting great performance in various natural language processing (NLP) tasks. Yet, their performance may face difficulties in specialized domains like law, healthcare and finance. This is a cause of specialized language and intricate terminologies found in these domains. Finetuning, a technique used to tailor LLMs to specific tasks, plays a crucial role in successfully adapting LLMs for specialized domains. This thesis investigates finetuning and efficient finetuning techniques. We will also investigate the replicability of the FinGPT methodology, explore potential enhancements, and evaluate the effectiveness of finetuning for domain-specific LLM development. Lastly, the potential of finetuning LLMs for Human Resources will be investigated.
Τα μεγάλα γλωσσικά μοντέλα επιδεικνύουν εξαιρετικές δυνατότητες στην κατανόηση της γλώσσας, παρουσιάζοντας υψηλές επιδόσεις σε διάφορες εργασίες επεξεργασίας φυσικής γλώσσας. Ωστόσο, η απόδοσή τους συχνά μειώνεται σε εξειδικευμένους τομείς, όπως το δίκαιο, η υγειονομική περίθαλψη και τα οικονομικά, λόγω της εξειδικευμένης ορολογίας και της σύνθετης χρήσης της γλώσσας σε αυτούς τους τομείς. Η απόδοσή τους μπορεί να βελτιωθεί περαιτέρω προσαρμόζοντας αυτά τα μοντέλα σε συγκεκριμένους τομείς ή εργασίες μέσω μιας διαδικασίας που ονομάζεται finetuning. Στη παρούσα διπλωματική θα ερευνήσουμε την δυνατότητα αναπαραγωγής προσαρμοσμένων μοντέλων στα χρηματοοικονομικά, διερευνάμε επίσης πιθανές βελτιώσεις και αξιολογούμε την αποτελεσματικότητα της προσαρμογής. Τέλος θα εξετάσουμε τις δυνατότητες προσαρμογής στον τομέα του Ανθρώπινου Δυναμικού.
Λέξη κλειδί Μεγάλα γλωσσικά μοντέλα
Προσαρμογή
Τεχνητή νοημοσύνη
Large language models
Finetuning
Artificial Intelligence (AI)
Διαθέσιμο από 2024-03-17 15:18:37
Ημερομηνία έκδοσης 07-03-2024
Ημερομηνία κατάθεσης 2024-03-17 15:18:37
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/