Λογότυπο αποθετηρίου
 

Πτυχιακές εργασίες

Μόνιμο URI για αυτήν τη συλλογήhttps://pyxida.aueb.gr/handle/123456789/11719

Περιήγηση

Πρόσφατες Υποβολές

Τώρα δείχνει 1 - 18 από 18
  • Τεκμήριο
    Construction and visualization of program dependence graph from JavaScript source code
    (2026-02-19) Giannou-Rizou, Pinelopi; Γιάννου-Ρίζου, Πηνελόπη; Diamantidis, Nikolaos
    Static code analysis is an essential part of the software development lifecycle and quality assurance processes. A wide range of tools that support static code analysis are available on the market. However, most existing tools focus on the final result of the analysis, concealing the intermediate processes that led to it. Although the information they provide is particularly useful, the lack of visibility into the intermediate stages of the analysis prevents a deeper understanding of how results are derived, thus limiting the educational value of these tools. The JS-Slicer tool was designed to fill this gap by analyzing and visualizing the individual stages of static code analysis. In static code analysis, the program's source code is examined without being executed. First, an Abstract Syntax Tree is constructed from the source code, which is then used to build the Control Flow Graph, representing all possible execution paths of the program. These structures had already been implemented for JS-Slicer. In the present thesis, building upon these existing structures, the following additional graphs were constructed: - Post-Dominator Tree (PDT), which identifies which statements are guaranteed to execute after each point in the program. - Control Dependence Graph (CDG), which captures the conditions upon which the execution of each statement depends. - Data Dependence Graph (DDG), which illustrates how data flows between the statements of the program. By merging the Control Dependence Graph and the Data Dependence Graph, the Program Dependence Graph (PDG) is produced, offering a comprehensive view of all dependencies present in the program. During the implementation of the graphs, various challenges were encountered, including variable shadowing and the handling of dynamic objects. As a result of this thesis, a functional Visual Studio Code extension is produced, allowing users to construct and visualize the aforementioned graphs for functions written in JavaScript.
  • Τεκμήριο
    Integration of digital twins into IoT/OT systems: cybersecurity challenges and regulatory compliance (NIS2, DORA)
    (2026-02-24) Samara, Maria; Σαμαρά, Μαρία; Stergiopoulos, George; Leventopoulos, Sozon; Gkritzalis, Dimitrios
    The rapid development of the Internet of Things (IoT) and Operational Technology (OT) systems reinforces the need for even more effective ways of monitoring and simulation. In this context, Digital Twins are a truly innovative technology that achieves the accurate representation of physical systems with the aim of predicting, detecting and optimizing vulnerabilities/anomalies. However, their integration into critical entities presents strict regulatory requirements. This paper explores the challenges created by the adoption of Digital Twins in IoT/OT systems and focuses on their compliance with two regulatory frameworks of the European Union: the NIS2 (Network and Information Security Directive 2) and the DORA (Digital Operational Resilience Act). Through a literature review, the requirements set by these regulations for the protection of critical infrastructures are examined. This study examines the potential of Digital Twins, as well as their limitations, with an emphasis on resilience and ensuring regulatory compliance.
  • Τεκμήριο
    Benchmarking audio language models for music performance assessment
    (2026-03-31) Zanou, Eleni; Ζάνου, Ελένη; Stafylakis, Themos
    Large audio-language models (LALMs) have been evaluated on a range of musical capabilities, including knowledge, reasoning, and information retrieval. However, the ability of LALMs to assess piano and guitar performances, including detecting, categorising, and describing mistakes, and providing useful feedback, remains unexplored. We address this gap by introducing a benchmark of 138 piano and guitar recordings, each either performed correctly or containing a single intentional mistake from one of seven categories including pitch, rhythm and timing, and harmony. We evaluate four models (Gemini 2.0 Flash, Qwen2.5-Omni-7B, Audio Flamingo 3, and Music Flamingo) on three tasks: classifying the type of mistake from a fixed set of options, describing the mistake in free text and providing corrective feedback, and comparing two performances of the same exercise against a given criterion. Free-text responses are further assessed through SBERT cosine similarity and an LLM-as-a-Judge approach with GPT-4o. Even the best-performing model, Gemini 2.0 Flash, achieves only 43.3% on multiple-choice classification, and three of four models fall below chance on pairwise comparison. The majority of mistake descriptions are rated as incorrect by the LLM judge, and no model consistently produces feedback that would be useful to a student. These results reveal a significant gap between current LALM capabilities and the requirements of music performance assessment.
  • Τεκμήριο
    Cybersecurity in software-defined vehicles: threats, risks and kill-switch mechanisms
    (2026-03-01) Viglis, Evangelos; Βίγλης, Ευάγγελος; Gkritzalis, Dimitrios
    The transition from traditional automotive architectures to software-defined vehicles (SDVs) introduces a fundamentally expanded cybersecurity landscape. The centralized computing, persistent cloud connectivity, over-the-air update mechanisms, and software-centric operations that define SDVs enable significant capabilities but simultaneously create new categories of security exposure that extend beyond conventional information technology concerns into the domain of physical safety. This thesis examines the cybersecurity challenges of SDVs through a structured analytical approach across three dimensions. First, it establishes the architectural foundations of SDVs and traces the historical evolution of automotive systems to identify how legacy design decisions shaped contemporary vulnerability patterns. Second, it maps the threat landscape across five attack surface categories and applies established risk assessment frameworks, revealing that current mitigation strategies are effective in prevention and detection but lack structured capabilities for real-time autonomous response, while the connected vehicle architecture introduces fleet-scale systemic risks that existing individual-vehicle assessment methodologies do not fully address. Third, it examines kill-switch mechanisms, defined as any mechanism capable of terminating or restricting vehicle operation, analyzing them as both a cybersecurity risk and a potential mitigation tool. This analysis identifies a fundamental design tension: increasing the accessibility of such a mechanism for legitimate use inherently expands the attack surface for unauthorized activation. The findings establish that the architectural features enabling SDV capabilities simultaneously produce their cybersecurity vulnerabilities, creating a recursive pattern where proposed solutions introduce new dimensions of the problems they address. The thesis contributes an original working definition and classification framework for kill-switch mechanisms in the automotive context, addressing a gap in the existing academic literature.
  • Τεκμήριο
    A two-stage optimization framework for last-mile delivery using a mobile depot
    (2026-03-03) Machaira, Panagiota; Μαχαίρα, Παναγιώτα; Mourtos, Ioannis; Avgerinos, Ioannis
    This thesis investigates the use of a Mobile Depot as a means of reducing total vehicle travel time in last-mile delivery operations. A two-stage optimization framework is proposed in which a Mobile Depot moves between selected urban locations to resupply delivery vehicles, enabling loading activities to occur closer to customer clusters and reducing the need for frequent returns to a remote central depot. In the first stage, a Mixed-Integer Linear Programming (MILP) model determines the route and schedule of the Mobile Depot, incorporating capacity, time-window and synchronization constraints. The objective of this stage is to minimize the travel effort imposed on the delivery vehicles by optimally selecting depot stops and assigning customer requests. In the second stage, a Pickup and Delivery Problem with Time Windows (PDPTW) is solved using the LKH-3 heuristic to construct feasible and efficient vehicle routes that respect the Mobile Depot’s availability and vehicle capacity limits. Using real-world last-mile delivery data, the proposed framework is evaluated against a conventional fixed-depot system. The results show that Mobile Depots do not provide uniform benefits across all operating conditions. Instead, their effectiveness depends on demand intensity and capacity constraints. In particular, the analysis identifies the circumstances under which the Mobile Depot significantly reduces total vehicle travel time, as well as scenarios where its impact is limited.
  • Τεκμήριο
    A posteriori unimodality for LLM bias detection
    (2026-03-11) Giannoutsos, Sokratis-Vissarion; Γιαννούτσος, Σωκράτης-Βησσαρίων; Pavlopoulos, Ioannis
    Recent studies show that biases exhibited by Large Language Models are not random, but the result of systematic and interpretable socio-demographic annotator perspectives, often reflecting majority-group viewpoints. In this work, we investigate whether \acp{LLM} reproduce similar polarization and subgroup-specific alignment patterns to those observed in human annotations. Firstly, we examined whether \acp{LLM} can become polarized in the same way as humans. Our analysis shows that six widely used \acp{LLM} (ChatGPT, DeepSeek, Gemini, Mistral, Llama, Grok) tend to align more strongly with the judgement patterns of female, white, and left-leaning subgroups when annotating toxic content, whereas humans themselves appear to be more strongly polarized along ideological attributes rather than hereditary characteristics. Then, we introduced a framework that examines how model behaviour changes when prompts explicitly ask the model to adopt demographic or ideological identities. Instead of aiming to reduce bias, this approach intentionally exposes language models to the same social viewpoints that drive polarization in the human data. This allows us to check whether model alignment with human groups reflects repetitive internal patterns or bias that emerges only when identity adoption happens at the prompt level. Finally, we extend the A Posteriori Unimodality framework, originally used to attribute polarization to specific dimensions—to support an extensive set of attributes. This subset includes ideological dimensions (e.g., politics and traditionalism) and ordinal attributes. For those, we introduce a threshold-based analysis that allows polarization to be identified across ordered subgroups, which in this study applies to age. This extension preserves the dimension-based nature of A Posteriori Unimodality while enabling finer-grained subgroup analysis and direct comparison with model behaviour. \\\textcolor{red}{\textbf{Disclaimer:} This thesis contains examples of toxic, offensive, and unsafe language collected from real-world datasets, included exclusively for research purposes and not intended to promote or endorse such content.}
  • Τεκμήριο
    Leveraging retrieval-augmented generation for student support: a document-centric QA system for the AUEB informatics studies guide
    (2025-07) Mitsakis, Nikos; Μητσάκης, Νικόλαος; Androutsopoulos, Ion; Stafylakis, Themos
    This thesis examines the design, development, and evaluation of a Retrieval-Augmented Generation (RAG) system specifically designed to support undergraduate students in the Department of Informatics at the Athens University of Economics and Business (AUEB). The central objective is to create a cost-effective yet high-quality AI assistant capable of answering studies guide-related questions, ensuring that all responses are explicitly grounded in the latest edition of the department's official Studies Guide. To achieve this, the system ingests the newest version of the Studies Guide. It represents its contents at three levels of granularity: chunks (bodies of text corresponding to paragraphs or groups of paragraphs on a specific topic, based on the document’s structure), sentences (extracted by sentence tokenizing each chunk), and propositions (decontextualized factual statements synthetically generated from the chunks). The retrieval architecture explores traditional lexical search (BM25), dense vector search, and a hybrid ensemble retriever to maximize retrieval coverage and relevance. Question-answering capabilities are assessed using both real-world and synthetic QA pairs, with the generation module leveraging self-hosted state-of-the-art large language models (LLMs). The thesis conducts a comprehensive evaluation across all document granularities and retrieval configurations, employing both classical information retrieval metrics and more modern LLM-based evaluation. Results demonstrate the feasibility of delivering a factual, responsive, and modular assistant using modest computational resources. The thesis further discusses the limitations and potential extensions of the approach, aiming to provide a blueprint for deploying similar RAG-based assistants in other academic settings.
  • Τεκμήριο
    Retrieval augmented generation on regulatory documents
    (2025-06-20) Chasandras, Ioannis; Χασάνδρας, Ιωάννης; Androutsopoulos, Ion; Chlapanis, Odysseas
    This thesis investigates the application of Retrieval Augmented Generation (RAG) in regulatory procedures through the emerging field of Regulatory NLP. Based on real-world regulatory documents, the study evaluates the performance of commercial retrieval models and introduces advanced, hybrid retrieval techniques tailored for legal compliance tasks. Given the critical need for precision and completeness in the legal domain, new algorithms that utilize Large Language Models (LLMs) are developed to enhance regulatory question-answering. The work also includes an adversarial evaluation of RePASs, a metric focused on legal obligations. Through participation in the RIRAG-2025 shared task, the thesis demonstrates both the promise and current limitations of AI systems in regulatory settings, emphasizing the need for further exploration in this field.
  • Τεκμήριο
    From pen to prediction: handwriting-based Alzheimer’s detection
    (2025-10-29) Boumpi, Maria; Μπουμπή, Μαρία; Pavlopoulos, John
    Detecting Alzheimer’s disease (AD) at an early stage is critical for planning effective treatments, supporting patients and their families, and slowing the progression of symptoms. Conventional practices, such as neuroimaging and biomarker assessment, tend to be costly and impractical for broad screening applications. This study tries to fill the gaps from previous studies and explore the ability of handwriting analysis as a non-invasive, accessible, and affordable way to identify AD. Our approach combines two perspectives, measurable features from pen movement patterns and handwritten images. The analysis integrated two datasets, the DARWIN dataset, which offers a range of tabular and image data from handwriting samples from multiple tasks, and the Alzheimer’s Disease Dataset (ADD), a detailed clinical dataset with demographic, medical, and cognitive assessment data. A series of classification approaches was applied, classic machine learning models (Random Forest, SVM, XGBoost) on tabular data, a deep learning-based Swin Transformer for images, and a multimodal classifier fusing the two modalities. The results confirm that the handwriting-based features are individually strong enough to be used as a diagnostic tool, as Random Forest achieved 83.03% ± 1.18 on DARWIN tabular data and XGBoost achieved 83.53% ± 3.44 on the ADD dataset. The Swin Transformer also managed to reach a consistent performance on handwriting images (80.02% ± 0.87) and was able to capture delicate motor and spatial anomalies that suggest cognitive decline. The best overall performance was achieved with a late fusion model that combined both modalities, achieving 89.15% ± 1.73 Accuracy. This highlights how combining visual and structured data can capture both neuromotor and cognitive impairment. Ablation studies looked at the effects of sequence and order on handwriting tasks and the bounds of joint training in data-constrained fusions. Studies have demonstrated that modular fusion provides more consistent and interpretable outcomes than any other method available in small-sample situations. In summary, handwriting, represented by measurable features from pen movement patterns and raw handwriting images, is simple, inexpensive, and reliable for detecting AD. It surpasses clinical performance while enabling home and clinical use.
  • Τεκμήριο
    Improvements to the explanations of Ithaca’s chronological attributions of ancient Greek inscriptions
    (2025-09-30) Schoinaki, Maria; Σχοινάκη, Μαρία; Androutsopoulos, Ion; Pavlopoulos, John; Assael, Yannis
    Τα μοντέλα τύπου Transformers, όπως το Ithaca, έχουν δείξει αξιοσημείωτη ικανότητα χρονολογικού προσδιορισμού αρχαίων ελληνικών επιγραφών. Παρ’ όλα αυτά, οι προβλέψεις τους παραμένουν αδιαφανείς και δύσκολες στην ερμηνεία από ιστορικούς και επιγραφολόγους. Στόχος της παρούσας πτυχιακής εργασίας είναι η βελτίωση των μηχανισμών εξηγήσεων του Ithaca στην εργασία χρονολόγησης, μέσω της ενσωμάτωσης και της συστηματικής σύγκρισης μεθόδων εκ των υστέρων επεξηγησιμότητας (post-hoc explainability), οι οποίες εφαρμόζονται τόσο σε επίπεδο αναπαράστασης χαρακτήρων όσο και σε επίπεδο λέξεων. Aναπτύσσουμε μια ενοποιημένη ροή επεξεργασίας σημαντικότητας (saliency), η οποία κανονικοποιεί τα μεμονωμένα αποτελέσματα, τα συγχωνεύει και παράγει απεικονίσεις θερμικών χαρτών (saliency maps) σε επίπεδο λέξης ή χαρακτήρα. Η προσέγγιση αυτή διατηρεί αναλλοίωτη την ακρίβεια χρονολόγησης του Ithaca, ενώ παράλληλα αναδεικνύει με συνέπεια ιστορικά κρίσιμους όρους και ονόματα που υποστηρίζουν τις χρονολογικές προβλέψεις. Ο συνοδευτικός κώδικας και το μεθοδολογικό πλαίσιο ενισχύουν την επεξηγησιμότητα των χρονολογικών αποδόσεων του Ithaca, καθιστώντας δυνατή τη βαθύτερη κατανόηση και την επικύρωση των αποφάσεων του μοντέλου από ιστορικούς και επιγραφολόγους.
  • Τεκμήριο
    Control flow graph generation from JavaScript source code
    (2025-09-24) Rigos, Gasparis; Ρήγος, Γασπάρης; Diamantidis, Nikolaos
    Η στατική ανάλυση κώδικα αποτελεί έναν από τους βασικούς τρόπους διασφάλισης της συντηρησιμότητας ενός προγραμματιστικού τμήματος, όπως μιας συνάρτησης ή ενός προγράμματος. Μέσω αυτού του είδους ανάλυσης, ο κώδικας εξετάζεται χωρίς να εκτελείται. Η στατική ανάλυση κώδικα μπορεί να πραγματοποιηθεί είτε χειροκίνητα μέσω ελέγχων κώδικα (code reviews) είτε αυτόματα με τη χρήση εξειδικευμένων εργαλείων που αναλύουν τον κώδικα. Η JavaScript ειδικότερα είναι μια διαβόητη γλώσσα για ανασκόπηση και αποσφαλμάτωση, λόγω της αφηρημένης και ευέλικτης φύσης της. Η χρήση Γραφημάτων Ροής Ελέγχου (Control Flow Graphs ή CFGs) συμβάλλει στη βελτίωση της αποδοτικότητας της χειροκίνητης ανάλυσης κώδικα, απεικονίζοντας τη ροή του ελέγχου μέσα σε μια δεδομένη συνάρτηση. Με την αξιοποίηση ενός αναλυτή πηγαίου κώδικα που δημιουργεί ένα Αφηρημένο Συντακτικό Δέντρο (Abstract Syntax Tree ή AST) μιας συνάρτησης, η παρούσα εργασία εξετάζει τις τεχνικές και τις μεθόδους που επιτρέπουν τη δημιουργία ενός CFG από το AST. Αυτές οι μέθοδοι ορίζουν μια λογική η οποία υλοποιείται σε μια ιδεολογία Visitor, η οποία χρησιμοποιείται για την ανάλυση του εισερχόμενου AST και την προοδευτική κατασκευή του CFG. Οι δυνατότητες αυτού του εργαλείου παρουσιάζονται στο τελευταίο μέρος της εργασίας, καθώς και οι διαφορετικοί τρόποι χρήσης και εγκατάστασής του ως επέκταση για το Visual Studio Code. Τέλος, το παραγόμενο αποτέλεσμα συγκρίνεται με άλλες διαθέσιμες λύσεις, με στόχο να εντοπιστούν τα πλεονεκτήματα του JS Slicer και τα συγκριτικά του οφέλη έναντι αυτών των άλλων εργαλείων.
  • Τεκμήριο
    Synthetic speech source tracing using metric learning
    (2025-09-16) Zacharopoulos, Stavros; Ζαχαρόπουλος, Σταύρος; Stafylakis, Themos
    Στην εργασία αυτή εξετάζουµε την πρόϰληση της ιχνηλάτησης της πηγής συνϑετιϰής οµιλίας, δηλαδή την αναγνώριση του µοντέλου που παρήγαγε ένα ηχητιϰό δείγµα, µέσω µεϑόδων εµπνευσµένων από την αναγνώριση οµιλητών. Σε αντίϑεση µε τη σχετιϰά ώριµη περιοχή της ανίχνευσης παραποιηµένης οµιλίας (spoofing detection), η ιϰανότητα αναγνώρισης του συστήµατος παραγωγής της παραποιηµένης φωνής παραµένει περιορισµένη, παρά την ιδιαίτερη σηµασία της για εφαρµογές ψηφιαϰής εγϰληµατολογίας ϰαι αντιµετώπισης παραπληροφόρησης. Προσεγγίζουµε το πρόβληµα συγϰρίνοντας δύο διαφορετιϰές στρατηγιϰές: την παρα δοσιαϰή ταξινόµηση ϰαι τη µάϑηση µε µετριϰές (metric learning). Για την υλοποίηση των προσεγγίσεών µας χρησιµοποιούµε δύο µοντέλα: ένα ResNet-34 µιϰρής υπολογισ τιϰής πολυπλοϰότητας ϰαι ένα αυτο-επιβλεπόµενο µοντέλο AASIST εµπλουτισµένο µε embeddings από Wav2Vec2. Πειραµατιζόµαστε µε διαφορετιϰές λειτουργίες απώλειας, µεϑόδους δειγµατοληψίας, ϰαϑώς ϰαι µεγέϑη εξόδου embeddings. Τα πειραµατιϰά µας αποτελέσµατα, που βασίζονται στο benchmark MLAADv5, δείχ νουν ότι η προσέγγιση µε ResNet σε συνδυασµό µε metric learning (ειδιϰά µε GE2E loss) πετυχαίνει εξαιρετιϰά χαµηλά ποσοστά σφάλµατος (EER), συγϰρίσιµα ή ϰαι ϰαλύτερα από αυτά του AASIST. Επιπλέον, δείχνουµε ότι αϰόµα ϰαι embeddings µιϰρής διαστατιϰότητας (10–50) επαρϰούν για αποδοτιϰή ταξινόµηση. Η µελέτη µας αναδειϰνύει τη δυνατότητα αξιοποίησης ελαφριών µοντέλων για την ιχνηλάτηση πηγής σε συνϑετιϰή οµιλία, παρέχοντας ένα πρώτο βήµα προς πιο αποδοτιϰά ϰαι εφαρµόσιµα εργαλεία για την ανίχνευση ϰαι ϰαταπολέµηση συνϑετιϰών µέσων.
  • Τεκμήριο
    Legal issues of artificial intelligence systems in cybersecurity
    (2025-07-10) Nepyyvoda, Anna; Νεπιϊβοντα, Άννα; Vagena, Evangelia
    Η παρούσα πτυχιακή εργασία αφορά τις νομικές προεκτάσεις της τεχνητής νοημοσύνης (ΤΝ) στον χώρο της κυβερνοασφάλειας, εξετάζοντας τη διττή της χρήση, τόσο ως μέσο επίθεσης όσο και μέσο προστασίας. Στα πλαίσια της εργασίας αναλύεται η αξιοποίηση τεχνολογιών ΤΝ από κακόβουλους φορείς για επιθέσεις phishing, δημιουργία deepfakes, διαρροή πληροφοριών και ανάπτυξη πολυμορφικού κακόβουλου λογισμικού. Παράλληλα, εξετάζονται οι αμυντικές εφαρμογές, όπως το Cyber Threat Intelligence, η ανίχνευση απειλών, η ανάλυση συμπεριφοράς, τα Συστήματα Ανίχνευσης/Πρόληψης Εισβολών (IDS/IPS) και η ανίχνευση phishing. Σκοπός της μελέτης είναι η συγκριτική νομική ανάλυση των ρυθμιστικών πλαισίων της Ευρωπαϊκής Ένωσης, των Ηνωμένων Πολιτειών και της Κίνας, ερευνώντας τα πλεονεκτήματα και τους περιορισμούς της προσέγγισης κάθε δικαιοδοσίας. Τα βασικά κείμενα στα οποία επικεντρώνεται η μελέτη είναι το AI Act, ο GDPR, η Οδηγία NIS2 και το Cyber Resilience Act στην Ε.Ε., το AI Bill of Rights, Executive Orders και Cyber Information Sharing Act στις Η.Π.Α., καθώς και οι Deep Synthesis και Generative AI Provisions και ο Νόμος της Κυβερνοασφάλειας στην Κίνα. Επιπλέον, η μελέτη εξετάζει τις νομικές επιπτώσεις μέσα από υποθετικά σενάρια, διερευνώντας την διαφοροποίηση της εφαρμογής του δικαίου ανάλογα με το εκάστοτε νομικό σύστημα. Η ανάλυση αυτή πλαισιώνεται από προτάσεις που στοχεύουν στην ενίσχυση της νομικής σαφήνειας και στην προώθηση της υπεύθυνης χρήσης της τεχνητής νοημοσύνης στον κυβερνοχώρο. Με αυτόν τον τρόπο, η εργασία επιδιώκει να συμβάλει ουσιαστικά στον σύγχρονο διάλογο γύρω από την τεχνητή νοημοσύνη και το δίκαιο του κυβερνοχώρου, αναδεικνύοντας την ανάγκη για ισχυρά και ευέλικτα νομικά πλαίσια που συμβαδίζουν με τις ταχείς τεχνολογικές εξελίξεις.
  • Τεκμήριο
    Automatic speech recognition for Greek medical dictation
    (2025-09-05) Georgilas, Vardis; Γεωργίλας, Βαρδής; Stafylakis, Themos; Stafylakis, Themos
    Η ιατριϰή υπαγόρευση αποτελεί µια πραϰτιϰή λύση που βοηθά τους επαγγελµατίες υγείας να µειώσουν τον χρόνο ϰαι την προσπάθεια που απαιτεί η γραπτή τεϰµηρίωση. Η παρούσα πτυχιαϰή εργασία έχει ως αντιϰείµενο την ϰατασϰευή ενός συστήµατος για την αυτοµατη µετατροπή ελληνιϰής ιατριϰής οµιλίας σε ϰείµενο. Υλοποιήθηϰε ένα σύστηµα που συνδυάζει τεχνιϰές αυτόµατης αναγνώρισης οµιλίας µε µοντέλα γλωσσιϰής αξιολόγησης για βελτίωση της αϰρίβειας. Με αυτόν τον τρόπο, το σύστηµα διαχειρίζεται αποτελεσµατιϰότερα την εξειδιϰευµένη ιατριϰή ορολογία ϰαι τις γλωσσιϰές ιδιαιτερότητες της ελληνιϰής γλώσσας, αντιµετωπίζοντας προβλήµατα που προϰύπτουν από την πολυπλοϰότητα της ορολογίας ϰαι τη µεταβλητότητα της προφοριϰής οµιλίας. Για την αυτόµατη αναγνώριση οµιλίας χρησιµοποιήθηϰε το µοντέλο Whisper, το οποίο εϰπαιδεύτηϰε περαιτέρω σε ελληνιϰά δεδοµένα ώστε να προσαρµοστεί ϰαλύτερα στις ανάγϰες του συγϰεϰριµένου τοµέα. Επιπλέον, αξιοποιήθηϰε ένα ειδιϰά προσαρµοσµένο ελληνιϰό GPT-2 µοντέλο, το οποίο λειτουργεί ως εργαλείο γλωσσιϰής αξιολόγησης, επιλέγοντας την ϰαταλληλότερη πρόταση ανάµεσα σε πολλαπλές πιθανές µεταγραφές που παράγονται από το Whisper. Η ενσωµάτωση της αϰουστιϰής ϰαι γλωσσιϰής πληροφορίας συµβάλλει σηµαντιϰά στην αύξηση της αϰρίβειας ϰαι της φυσιϰότητας των τελιϰών ϰειµένων. Με αυτή την προσέγγιση, το σύστηµα στοχεύει στη δηµιουργία αξιόπιστων ϰαι ϰατανοητών µεταγραφών, προσφέροντας ένα χρήσιµο εργαλείο για την υποστήριξη της ϰαθηµερινής εργασίας στον τοµέα της υγείας.
  • Τεκμήριο
    Ανάπτυξη Android εφαρμογών με χρήση Jetpack Compose
    (2025-07-18) Φασόης, Παύλος; Διαμαντίδης, Νικόλαος
    Η παρούσα πτυχιακή εργασία επικεντρώθηκε στη μετάβαση μιας υπάρχουσας Android εφαρμογής βιβλιοθήκης από την παραδοσιακή δομή UI, που βασίζεται σε XML layouts και Activities, στο σύγχρονο πλαίσιο του Jetpack Compose. Ο κύριος στόχος ήταν η βελτίωση της διαχειρισιμότητας, της επαναχρησιμοποίησης και της επεκτασιμότητας του κώδικα, διατηρώντας παράλληλα την πλήρη λειτουργικότητα της εφαρμογής. Η εργασία εξέτασε τα θεωρητικά υπόβαθρα των αρχιτεκτονικών προτύπων Model-View-Controller (MVC), Model-View-Presenter (MVP) και Model-View-ViewModel (MVVM), αναλύοντας τα πλεονεκτήματα και τα μειονεκτήματά τους, με ιδιαίτερη έμφαση στο πώς το MVVM συνδυάζεται άρτια με το Jetpack Compose για τη δημιουργία μιας αποδοτικής και εύκολα συντηρήσιμης διεπαφής.
  • Τεκμήριο
    Εφαρμογή μεθόδων και τεχνικών τεχνητής νοημοσύνης για την ασφάλεια συστημάτων λογισμικού
    (2025-03-20) Τριανταφυλλοπούλου, Παναγιώτα; Διαμαντίδης, Νικόλαος
    Η παρούσα πτυχιακή εργασία έχει ως θέμα την Εφαρμογή Μεθόδων και Τεχνικών Τεχνητής Νοημοσύνης (AI) στο Πλαίσιο του NIST Cybersecurity Framework (CSF). Σκοπός της ανάλυσης αυτής είναι να διερευνήσει τις σύγχρονες μεθόδους και τεχνικές που χρησιμοποιούνται στον τομέα της κυβερνοασφάλειας για την πρόληψη, την ανίχνευση, την αντίδραση και την αποκατάσταση από κυβερνοεπιθέσεις, με βάση τις αρχές και τις οδηγίες του CSF. Το NIST Cybersecurity Framework, που έχει αναπτυχθεί από το Εθνικό Ινστιτούτο Πρότυπων και Τεχνολογίας (NIST), αποτελεί ένα σύνολο κατευθυντήριων γραμμών και βέλτιστων πρακτικών που στοχεύουν στην ενίσχυση της κυβερνοασφάλειας οργανισμών κάθε μεγέθους και τομέα. Η συγκεκριμένη εργασία επικεντρώνεται στην ενσωμάτωση τεχνικών τεχνητής νοημοσύνης για την αντιμετώπιση των απειλών και κινδύνων στον κυβερνοχώρο, λαμβάνοντας υπόψη την πρόσφατη ερευνητική δραστηριότητα στον τομέα αυτό. Η εργασία βασίζεται στη βιβλιογραφική ανασκόπηση που περιγράφεται στο άρθρο των Kaur, Gabrijelčič, και Klobučar, με τίτλο «Artificial Intelligence for Cybersecurity: Literature Review and Future Research Directions». Στην παρούσα πτυχιακή εργασία, η ανάλυση είναι δομημένη σύμφωνα με τις τέσσερις βασικές λειτουργίες του πλαισίου NIST: 1. Προσδιορισμός – Ταυτοποίηση των περιουσιακών στοιχείων και των απειλών. 2. Προστασία – Μέσω εφαρμογής μέτρων άμυνας και πρόληψης. 3. Εντοπισμός – Ανίχνευση κυβερνοεπιθέσεων και απειλών σε πραγματικό χρόνο. 4. Ανταπόκριση – Άμεση αντίδραση και αποκατάσταση μετά από επιθέσεις.
  • Τεκμήριο
    Enhanced biomedical image tagging
    (2024-09-15) Chatzipapadopoulou, Anna; Χατζηπαπαδοπούλου, Άννα; Androutsopoulos, Ion; Pavlopoulos, John
    Medical image classification is a complex and fascinating task that has significantly benefited from advancements in deep learning techniques. This thesis focuses on the specific challenge of multi-class multi-label medical image classification, also known as medical image tagging. The objective is to accurately assign relevant medical terms (concepts/tags) to images, which describe potential findings and ultimately assist clinicians in the diagnostic process. Medical image tagging may involve analyzing images from various modalities, such as X-rays, MRIs, CT scans, and ultra sonographies, to identify and categorize different pathological conditions. To address the task of medical image tagging, we develop and evaluate various deep learning models that encode the images and combine them with both classification-based and retrieval-based approaches. Ultimately, our goal is to develop a robust and reliable system for medical image tagging that not only provides clinicians with supportive information but also assists them in diagnosing diseases more accurately and efficiently.
  • Τεκμήριο
    Tuples-DMM: a retrieval-enhanced concept-driven guided decoding algorithm
    (2024-10-25) Plavos, Dimosthenis; Πλαβός, Δημοσθένης; Pavlopoulos, Ioannis
    Η αυτόµατη περιγραφή ιατριϰών ειϰόνων αποτελεί µια εξελισσόµενη διαδιϰασία στον τοµέα της Τεχνητής Νοηµοσύνης που περιλαµβάνει την αυτόµατη παραγωγή περιγραφιϰών λεζαντών για τέτοιες ειϰόνες. Ενισχύεται από τις προόδους στις τεχνολογίες απειϰόνισης ϰαι τον αυξανόµενο αριϑµό ασϑενών, τα οποία έχουν οδηγήσει στη δηµιουργία ενός µεγάλου αριϑµού αϰτινολογιϰών ειϰόνων στις µονάδες υγειονοµιϰής περίϑαλψης παγϰοσµίως. Η ανάλυση αυτών των ειϰόνων απαιτεί σηµαντιϰή ποσότητα χρόνου από τους ϰλινιϰούς ιατρούς, γεγονός που ϰαϑιστά την αυτοµατοποίηση αυτής της διαδιϰασίας ένα µέσο εξοιϰονόµησης χρόνου. Οι αυτόµατα δηµιουργούµενες λεζάντες µπορούν επίσης να χρησιµεύσουν ως εργαλεία για την ϰαϑοδήγηση της διαγνωστιϰής διαδιϰασίας ή την επιβεβαίωση των ευρηµάτων των ϰλινιϰών ιατρών. Η πτυχιαϰή αυτή εργασία επιϰεντρώνεται στην Παραγωγή ∆ιαγνωστιϰής Περιγραφής (Diagnostic Captioning), η οποία αναφέρεται στη δηµιουργία ϰειµενιϰών περιγραφών µε στόχο την αναγνώριση ϰαι µετάδοση διαγνωστιϰών πληροφοριών από ιατριϰές ειϰόνες. Για την υλοποίησή της, χρησιµοποιεί το σύνολο δεδοµένων ImageCLEFmedical 2023. Η προτεινόµενη µέϑοδος TuplesDMM βασίζεται στη µέϑοδο DMM (Distance from Median Maximum), που αποτελεί µια µεϑοδολογία Καϑοδηγούµενης Αποϰωδιϰοποίησης βασισµένη σε"ϰεντριϰές έννοιες" ϰαι παρουσιάστηϰε από τον Kaliosis ϰαι άλλους [Kal+24]. Η µέϑοδος DMM δηµιουργεί περιγραφές ενσωµατώνοντας ρητά ή άρρητα τις έννοιες που σχετίζονται µε µια ιατριϰή ειϰόνα, σύµφωνα µε τον τρόπο που αυτές οι έννοιες εϰπροσωπούνται στα παραδέιγµατα εϰπαίδευσης. Η µέϑοδος Tuples-DMM ϰαι οι τροποποιήσεις της στοχεύουν στην ανάϰτηση των πιο σχετιϰών δεδοµένων εϰπαίδευσης ϰαι την τροποποίηση του αλγορίϑµου DMM. Ο στόχος είναι η βελτίωση της ϰαϑοδηγούµενης δηµιουργίας µέσω της αποφυγής της επιρροής από δεδοµένα εϰπαίδευσης που αντιπροσωπεύουν άσχετα νοηµατιϰά ϑέµατα ϰαι της εστίασης σε σχετιϰά νοηµατιϰά δεδοµένα εϰπαίδευσης, προϰειµένου να επιτευχϑούν πιο αϰριβείς ϰαι νοηµατιϰά ουσιαστιϰές περιγραφές.