Πλοήγηση ανά Επιβλέπων "Papageorgiou, Haris"
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Τώρα δείχνει 1 - 7 από 7
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Entity based sentiment analysis in financial data(22-03-2023) Αγγέλης, Αθανάσιος; Angelis, Athanasios; Athens University of Economics and Business, Department of Management Science and Technology; Kotidis, Yannis; Chatziantoniou, Damianos; Papageorgiou, HarisΟ στόχος της μεθόδου Sentiment Analysis στον χρηματοοικονομικό τομέα, ουσιαστικά αναφέρεται στην ποσοτικοποίησστη και την ανάλυση του συναισθήματος το οποίο εξάγεται από χρηματοοικονομικά κείμενα, για διαφορετικούς σκοπούς όπως οι επενδύσεις, η κερδοφορία μιας εταιρείας κ.λπ. Στην εποχή του μεγάλου όγκου δεδομένων (big data), η ανάπτυξη διαφόρων τύπων κειμένων με χρηματοοικονομικό περιεχόμενο αποτελεί μια μεγάλη πρόκληση για τις περισσότερες εταιρείες ή οργανισμούς που προσπαθούν να αντλήσουν αξία από αυτά. Τα κείμενα αποτελούν αδόμητα δεδομένα και επομένως είναι δύσκολο να επεξεργαστούν και να αναλυθούν. Ωστόσο, είναι πολύ σημαντικό για τις εταιρείες να αναπτύξουν κάποια εργαλεία ώστε να μπορούν να λαμβάνουν καλύτερες οικονομικές αποφάσεις χρησιμοποιώντας τον τεράστιο όγκο των οικονομικών κειμένων στο Διαδίκτυο. Σε αυτή τη διατριβή, προσπαθούμε να εξαγάγουμε το συναίσθημα για συγκεκριμένες οντότητες (Entity based Sentiment Analysis) από διάφορα οικονομικά κείμενα με τη βοήθεια αλγορίθμων μηχανικής μάθησης. Χρησιμοποιούμε ταξινομητές όπως Random Forest, Bagging, Gradient Boosting και Voting και με βάση τα αποτελέσματα ο ταξινομητής Voting αποδίδει καλύτερα από τους άλλους.Τεκμήριο ESG data collection and analysis for energy companies in Europe(30-08-2023) Δημητρίου, Ιωάννης; Dimitriou, Ioannis; Athens University of Economics and Business, Department of Management Science and Technology; Pramatari, Aikaterini; Chatziantoniou, Damianos; Papageorgiou, HarisDuring the recent decades a growing global focus on environmental pollution, social inequalities, and corporate governance, prompting increased initiatives towards responsible and sustainable practices has been witnessed. Sustainable Investment has emerged as critical concern for both investors and companies, driven by evolving regulations and government incentives. To ensure the effectiveness of sustainable development, quantification, measurement, and monitoring are imperative, leading to the development of Environmental, Social, and Governance (ESG) frameworks and metrics.However, the lack of a common ESG framework, even within specific regions or industries, coupled with the non-mandatory disclosure of information by companies, presents challenges for automated measurement and monitoring. Recognizing the potential of Artificial Intelligence (AI) and Large Language Models (LLMs), this thesis aimed to automate the collection of ESG information from publications of Energy Companies in the European Union (EU). The selected ESG metrics, spanning environmental, social, and governance scopes, were utilized for data collection through LLMs, leveraging prompt engineering for precise extraction.The project addressed the broader goal of integrating automated ESG reporting, details the challenges of ESG data collection, discusses EU regulations, and highlights widely used ESG standards and research providers. The majority of the paper delves into the project's methodology, explaining the chosen ESG metrics, the initial approach, and the subsequent shift to utilizing LLMs for automated data retrieval. Detailed descriptions of techniques for data collection, pre-processing and metrics standardization follow. The ultimate objective is the analysis of collected data and insights extraction through visualization tools, examining the maturity of the Energy sector in the EU regarding ESG information publication.The analysis occurs on two levels: a higher level assessing the overall maturity and a detailed level scrutinizing ESG metrics data. Tools used in the project are outlined, and potential future improvements are discussed, emphasizing the initiative's broader scope beyond its immediate timeframe.Τεκμήριο Fact checking science journalism(31-03-2023) Καλλαράς Χρήστος; Kallaras, Christos; Athens University of Economics and Business, Department of Management Science and Technology; Karlis, Dimitrios; Chatziantoniou, Damianos; Papageorgiou, HarisΣτη σημερινή ψηφιακή εποχή, οι πληροφορίες είναι άμεσα διαθέσιμες στα χέρια μας και η πρόκληση έγκειται στον προσδιορισμό της αξιοπιστίας και της αυθεντικότητας αυτών των πληροφοριών. Με την ανάπτυξη των μέσων κοινωνικής δικτύωσης και του διαδικτύου, η παραπληροφόρηση και οι ψεύτικες ειδήσεις έχουν γίνει ανεξέλεγκτες, οδηγώντας σε σύγχυση το κοινό και αύξηση της δυσπιστίας. Κατά συνέπεια, ο εντοπισμός βάσιμων ισχυρισμών και ο εντοπισμός του ατόμου ή της οντότητας που το ισχυρίστηκε έχει καταστεί κρίσιμο έργο στον τομέα της επεξεργασία φυσικής γλώσσας, το οποίο μπορεί να βοηθήσει στη μείωση της διάδοσης παραπληροφόρησης και στην αύξηση της εμπιστοσύνης. Στην παρούσα μεταπτυχιακή διπλωματική παρουσιάζεται μια μελέτη σχετικά με τον εντοπισμό ισχυρισμών και των ατόμων ή της οντότητας που το ισχυρίστηκαν, η οποία στοχεύει στον αυτόματο εντοπισμό τους σε δεδομένα κειμένου. Η εργασία είναι εμπνευσμένη από το NewsClaim benchmark, το οποίο εστιάζει στον εντοπισμό ισχυρισμών σε άρθρα ειδήσεων. Επεκτείνω αυτήν την εργασία εκπαιδεύοντας το μοντέλο φυσικής γλώσσας που χρησιμοποιείται από την εργασία, δηλαδή ένα μοντέλο adversarial BERT, σε ένα σύνολο δεδομένων 1500 άρθρων που σχετίζονται με το κλίμα και την υγεία, το οποίο μας επέτρεψε να εντοπίσουμε ισχυρισμούς με υψηλή ακρίβεια. Επιπλέον, παρουσιάζω μια ανάλυση δύο υφιστάμενων συνόλων δεδομένων και ενός νέου που βασίζεται στους τομείς της υγείας και των τροφίμων. Ο στόχος είναι να προβλέψω ποιος έκανε έναν ισχυρισμό και για αυτό εκπαίδευσα τέσσερα μοντέλα, τα RoBERTa, DistilBERT, BART και ALBERT στα προαναφερθέντα σύνολα δεδομένων. Τα πειράματά μου δείχνουν ότι το μοντέλο DistilBERT είχε την καλύτερη απόδοση στα δύο πρώτα σύνολα δεδομένων, αλλά η απόδοσή του ήταν κακή στο καινούργιο λόγω του μικρού όγκου των δεδομένων. Τα ευρήματα και τα μοντέλα αυτής της έρευνας στοχεύουν στο να συμβάλουν στην ανάπτυξη αποτελεσματικών μοντέλων ερώτησης-απάντησης, με πιθανές εφαρμογές σε τομείς όπως η δημοσιογραφία και ο έλεγχος γεγονότων.Τεκμήριο Spatio-textual data integration with Artificial Intelligence (AI): toponym interlinking(30-07-2020) Ntzoufas, Alexandros; Ντζούφας, Αλέξανδρος; Papageorgiou, Haris; Παπαγεωργίου, ΧάρηςToponym matching comprises the problem of identifying same real-world spatio-textual entities exclusively based on their name. It is a fundamental problem for several applications related to geographical information retrieval and the geographical information sciences, such as conflation of digital gazetteers or point-of-interest datasets, address parsing in geocoding and map search services or toponym resolution over textual contents, digitized maps and digital library contents (Santos, Murrieta-Flores, Pável, & Martins, 2017). This study is dealing with pairs of toponyms which either refer to the same place or not. Given a random toponym pair, this study is trying to predict whether it is matching or non-matching (true or false) by exploiting classification algorithms. The main pillars of the toponym matching approach which we followed in the context of this study are three: a) the word embedding learning models, b) the feature extraction methods and c) machine learning and deep learning classification algorithms. As expected, the deep learning algorithms exceeded in performance the machine learning algorithms. The fully connected neural network reached the highest f1-score and accuracy, followed by LSTM and CNN, while MLP performed better than XG Boost and Random Forest. More specifically, the f1-score and accuracy of the fully connected model were equal to 85.2% and 85.05%, respectively. It’s worth mentioning that the results of our approach exceeded significantly several published results based on string similarity metrics (Santosa, Murrieta-Floresb, & Martins, 2018) while they are quite close to state of the art.Τεκμήριο Tackling climate misinformation with AI(31-03-2024) Ζάραγκα, Ευτυχία; Zaragka, Eftychia; Athens University of Economics and Business, Department of Management Science and Technology; Chatziantoniou, Damianos; Papastefanatos, George; Papageorgiou, HarisΗ αυξανόμενη διανομή παραπληροφόρησης σχετικά με την κλιματική αλλαγή αποτελεί τεράστια πρόκληση για τη δημόσια γνώση και δράση σχετικά με την κλιματική αλλαγή. Η παρούσα διπλωματική εργασία, με τίτλο "Αντιμετώπιση της Κλιματικής Παραπληροφόρησης με τη Χρήση Τεχνητής Νοημοσύνης", εξετάζει τη χρήση Τεχνητής Νοημοσύνης (ΤΝ) και προσεγγίσεων Επεξεργασίας Φυσικής Γλώσσας (NLP) για την ανίχνευση και καταπολέμηση της παραπληροφόρησης στον τομέα της κλιματικής αλλαγής, με ιδιαίτερη έμφαση στην επιστημονική βιβλιογραφία. Στόχος της μελέτης είναι ο σχεδιασμός και η δοκιμή μοντέλων Τεχνητής Νοημοσύνης, ειδικά μοντέλων βασισμένων στο FLAN-T5 ενισχυμένα με την Προσαρμογή Χαμηλής Βαθμίδας (Low – Rank Adaptation or LoRa), για την ικανότητά τους να διακρίνουν μεταξύ σωστών πληροφοριών και παραπλανητικών ισχυρισμών σε επιστημονικά άρθρα για το κλίμα και την υγεία.Η μελέτη αυτή αντιμετωπίζει την σημαντική ανάγκη για τεχνολογίες που μπορούν γρήγορα να εντοπίζουν και να διορθώνουν παραπλανητικές αφηγήσεις σχετικά με την κλιματική αλλαγή χρησιμοποιώντας μια συστηματική προσέγγιση που καλύπτει τη συλλογή δεδομένων, την προεπεξεργασία, την εκπαίδευση μοντέλων και την αξιολόγηση. Η διπλωματική εργασία υποδεικνύει ότι η προσαρμογή μοντέλων Τεχνητής Νοημοσύνης με Προσαρμογή Χαμηλής Βαθμίδας (LoRa) αυξάνει σημαντικά την ικανότητά τους να ανιχνεύουν παραπλανητικές δηλώσεις, καθιστώντας την μια ελκυστική προσέγγιση για τη βελτίωση της ποιότητας και της αξιοπιστίας των πληροφοριών στον δημόσιο διάλογο.Η διεξαγόμενη έρευνα είναι σημαντική πέρα από τις άμεσες ακαδημαϊκές συνεισφορές της, καθώς καταδεικνύει τη δυνατότητα των τεχνολογιών ΤΝ και NLP να συνεισφέρουν στη λήψη αποφάσεων και στη δημόσια πολιτική βάσει αποδείξεων. Η διπλωματική αυτή εργασία παρέχει το πλαίσιο για μελλοντική έρευνα στον τομέα προτείνοντας μια ολοκληρωμένη προσέγγιση για τον εντοπισμό της παραπληροφόρησης σχετικά με το κλίμα, καθώς και υπογραμμίζει τη θεμελιώδη σημασία της σύγχρονης τεχνολογίας στην εξασφάλιση της ακρίβειας της επιστημονικής συζήτησης για την κλιματική αλλαγή.Τεκμήριο Text analytics: identifying contact reason based on the call content(31-03-2020) Woznialis, Laura; Athens University of Economics and Business, Department of Management Science and Technology; Papageorgiou, HarisNatural Language Processing (NLP) and Machine Learning (ML) concepts can serve as a powerful tool in an era of rapidly growing data. It can reveal unseen information from the vast amounts of unstructured textual data, which can be helpful in adjusting business strategy. The primary purpose of this graduation thesis Text Analytics –Identifying contact reason based on the call content is to determine whether it is feasible to create insights from automatically transcribed calls and identify the reason behind customers contact. In the age of automation and efficiency it is necessary to search for new ways to gain actionable data and fully explore its value. To successfully execute the study, over 11,000 transcripts were used from calls across various call center domains. The proposed approach classifies the calls according to its content. After data preparation and feature extraction using TF-IDF text vectorization, calls were separated into tree clusters, reflecting main call categories in the given dataset: vehicles, parking pass and general inquiries. Upon the selection of calls from category vehicles Topic Modeling was performed on analyzed data using Latent Dirichlet Allocation (LDA) based model. Topic Modeling results identified six topics within selected cluster. The output of LDA model was a list of words and associated probabilities which were used to interpret and label topics of the model. Assigned topic labels reflected main inquiries regarding vehicles: questions about purchasing, discussing a deal, application for a credit, issues with warranty, exchanging of contact details and searching for information on the website.Each of above-mentioned topics could be assigned with different suggestions and action plan. Such insights could assist businesses to take data driven decisions and efficiently allocate their resources. Further studies are needed to take place in order to explore to the underlying patterns within the topics and call characteristics.Τεκμήριο Towards AI-driven science-based policy intelligence(28-05-2024) Αρκουμάνη, Γεωργία; Arkoumani, Georgia; Athens University of Economics and Business, Department of Management Science and Technology; Chatziantoniou, Damianos; Papastefanatos, George; Papageorgiou, HarisΗ πληθώρα των πληροφοριών που είναι διαθέσιμες στο διαδίκτυο στη σημερινή ψηφιακή εποχή έχει οδηγήσει στην ανάπτυξη προηγμένων μεθόδων εξαγωγής και ανάλυσης δεδομένων. Η συλλογή δεδομένων από το διαδίκτυο, γνωστή και ως «σέρφινγκ δεδομένων», είναι ένα κρίσιμο βήμα σε αυτή τη διαδικασία, καθώς επιτρέπει στους ερευνητές να συγκεντρώνουν σημαντικά δεδομένα από διαδικτυακές πηγές. Ωστόσο, ένας σημαντικός αριθμός σημαντικών εφαρμογών και εργαλείων, όπως Μηχανές Αναζήτησης, Εργαλεία για την Επιστημονική Βιβλιογραφία, Συστήματα Προτάσεων και Παρακολούθησης της Επιστήμης, εξαρτώνται από την ταξινόμηση των επιστημονικών δημοσιεύσεων που συμμορφώνονται με τις ταξινομίες των Πεδίων της Επιστήμης. Οι χρηματοδότες, οι εκδότες, οι ακαδημαϊκοί, οι επιχειρήσεις και άλλοι ενδιαφερόμενοι μπορούν επίσης να χρησιμοποιούν αυτές τις ταξινομίες για να οργανώσουν καλύτερα την επιστημονική βιβλιογραφία, να υπολογίσουν δείκτες επιπτώσεων κατά μήκος των επιστημονικών διαδρομών επιπτώσεων και να εντοπίσουν νέες περιοχές που μπορούν να υποστηρίξουν την ανάπτυξη πολιτικής για την Επιστήμη, την Τεχνολογία και την Καινοτομία. Εξαιτίας αυτού, πολλές ταξινομικές σχηματοποιήσεις βρίσκονται σήμερα σε χρήση για τις επιστημονικές δημοσιεύσεις, υποστηρίζοντας ένα σημαντικό μέρος της αξιολόγησης της έρευνας. Δυστυχώς, πολλές από τις τρέχουσες σχηματοποιήσεις είναι εξειδικευμένες, αποτελούνται από λίγα επίπεδα λεπτομέρειας και απαιτούν συνεχή χειρωνακτική εργασία, κάτι που καθιστά δύσκολη την παρακολούθηση του γρήγορα μεταβαλλόμενου επιστημονικού τοπίου καθώς προκύπτουν νέα ερευνητικά θέματα. Επιπλέον, τα εργαλεία τεχνητής νοημοσύνης είναι απαραίτητα για την επίδειξη των δυνατοτήτων και των πιθανών χρήσεων των συστημάτων τεχνητής νοημοσύνης. Ωστόσο, η ποιότητα της παρουσίασής τους και η εμπειρία χρήστη έχουν σημαντική επίδραση στο πόσο καλά μπορούν να επιδείξουν αυτά τα χαρακτηριστικά.