Πλοήγηση ανά Επιβλέπων "Kalogeraki, Vana"
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Τώρα δείχνει 1 - 19 από 19
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Analysing security vulnerabilities in Google’s Privacy Sandbox: attacks on the Protected Audience API(14-03-2025) Μωραΐτου, Άννα; Moraitou, Anna; Athens University of Economics and Business, Department of Informatics; Gunopoulos, Dimitrios; Gkritzalis, Dimitrios; Kalogeraki, VanaΗ ραγδαία εξέλιξη των διαδιϰτυαϰών διαφημίσεων έχει εντείνει τις ανησυχίες για την ιδιωτιϰότητα των χρηστών, οδηγώντας στην ανάπτυξη πλαισίων που προστατεύουν την ιδιωτιϰότητα, όπως το Privacy Sandbox της Google. Κεντριϰό στοιχείο αυτής της πρωτοβουλίας αποτελεί το Protected Audience API, το οποίο έχει σχεδιαστεί για να υποστηρίζει διαφημίσεις βάσει ενδιαφερόντων, επιδιώϰοντας ταυτόχρονα να περιορίσει την παραϰολούϑηση ϰαι την έϰϑεση δεδομένων των χρηστών. Ωστόσο, η παρούσα διπλωματιϰή εργασία αξιολογεί την ανϑεϰτιϰότητα του API απέναντι σε γνωστές ϰαι νέες μεϑόδους επίϑεσης, αποϰαλύπτοντας σημαντιϰά ϰενά ασφάλειας.Η έρευνα ξεϰινά με μια εϰτενή επισϰόπηση υφιστάμενων τεχνολογιών προστασίας της ιδιωτιϰότητας, της αρχιτεϰτονιϰής του Protected Audience API, ϰαϑώς ϰαι της σχετιϰής βιβλιογραφίας στον τομέα της ασφάλειας ϰαι της διατήρησης του απορρήτου των ψηφιαϰών διαφημίσεων. Γνωστές επιϑέσεις στο API, όπως αυτές που εϰμεταλλεύονται τα πεδία biddingWasmHelperURL ϰαι trustedScoringSignalsURL, υλοποιούνται ϰαι αξιολογούνται ως προς την αποτελεσματιϰότητα ϰαι την επεϰτασιμότητά τους. Επιπλέον, αναπτύσσεται ϰαι δοϰιμάζεται μια ϰαινούργια επίϑεση που στοχεύει την παράμετρο buyerAndSellerReportingId, αποδειϰνύοντας τη δυνατότητα αναϰατασϰευής των αναγνωριστιϰών χρηστών μεταξύ διαφορετιϰών τομέων (domains).Το πλαίσιο αξιολόγησης μετρά τα ποσοστά επιτυχίας, τους χρόνους εϰτέλεσης ϰαι τις επιπτώσεις στην ιδιωτιϰότητα των χρηστών αυτών των επιϑέσεων υπό διαφορετιϰά σενάρια φόρτου χρηστών. Τα αποτελέσματα δείχνουν ότι πολλές επιϑέσεις επιτυγχάνουν ποσοστά επιτυχίας 100% ϰαι διατηρούν την επεϰτασιμότητά τους με ελάχιστη υποβάϑμιση της απόδοσης, αναδειϰνύοντας ϰρίσιμα ϰενά στην ιϰανότητα του API να προστατεύει τα δεδομένα των χρηστών. Επιπλέον, τα ευρήματα υπογραμμίζουν την αντίφαση μεταξύ της διαφύλαξης της ιδιωτιϰότητας των χρηστών ϰαι της διατήρησης της αποτελεσματιϰότητας της διαφήμισης βάσει ενδιαφερόντων.Η παρούσα διπλωματιϰή εργασία συμβάλλει στη συνεχιζόμενη συζήτηση για τη διαφήμιση που προστατεύει την ιδιωτιϰότητα, εντοπίζοντας αδυναμίες στο Protected Audience API. Τα ευρήματα τονίζουν την ανάγϰη για ενισχυμένες διϰλείδες ασφαλείας, όπως ισχυρότερες τεχνιϰές ανωνυμοποίησης ϰαι δυναμιϰά μέτρα ασφάλειας, ώστε το Privacy Sandbox να επιτύχει τον στόχο του να ισορροπήσει την ιδιωτιϰότητα ϰαι τη λειτουργιϰότητα.Τεκμήριο Delay optimal task scheduling for mobile-edge computing systems(20-12-2021) Papageorgiou, Ioannis; Παπαγεωργίου, Ιωάννης; Athens University of Economics and Business, Department of Informatics; Siris, Vasilios; Voulgaris, Spyridon; Kalogeraki, VanaThe current research is called to explore a modern solution, in order to minimize the total average time delay of the completion of the task and at the same time to take into account the energy consumption of the mobile device, as the mobile devices have limited resources. The problem of lack of resources can be addressed with the Cloud computing environment, but when it comes to a balance between resources and time efficiency, the Mobile-Edge Computing environment is the solution. The basic idea behind MEC is that by running applications and performing related processing tasks closer to the client-user mobile network, network congestion is reduced and applications perform better. The main dilemma to deal with when performing tasks is deciding whether a task should be performed locally (on the mobile device) or offloaded to a MEC- server. A two-step decision process is adopted to handle this problem, where the computation tasks are scheduled based on the queuing state of the task buffer, the execution state of the local processing unit, as well as the state of the transmission unit.As computing operations take place on the mobile device or the MEC, the offloading policy is expected to make decisions about the remaining tasks/operations in the queue (when and which are locally scheduled or at the MEC server). To minimize this objective function, an optimization problem has been formulated cocnerning time delay and energy consumption limitations. A one-dimensional search algorithm based on execution and power consumption parameters is proposed to solve this optimization problem, in order to provide the optimal task scheduling, in terms of time latency. Experimental results of proposing such a mixed scheduling strategy are encouraging, illustrating the efficiency of current approach.Τεκμήριο Design and implement a highly extensible no/low code, cloud application development platform(31-10-2023) Koutsouris, Stefanos; Κουτσούρης, Στέφανος; Athens School of Economics and Business, Department of Informatics; Gritzalis, Dimitrios; Xylomenos, George; Kalogeraki, VanaNowadays, most of the large scale application systems that have already matured, rely on a specific architectural pattern(s) and follow best practices in their implementation. They have defined the basic concepts and flows on how they work, how they communicate with other components or third party providers, and any new feature implementation will most likely follow the same patterns and concepts, since consistency is one of the most valuable qualities of a maintainable large scale system. Unfortunately, for a system that is being developed for many years, by many different developers and has probably also changed many architects and tech leads, consistency is not something that can be kept intact easily. Also some systems start small but when the time comes, they can’t scale enough and they have to refactor everything or even rebuild the system from scratch in order to be able to expand. A solution could be to help architects and developers to make some important decisions when they start implementing a new system, and help them stick to them or extend them with scalable solutions that can be combined along with their initial decisions. As always, if we want to enforce some basic rules so that we can achieve a high level of consistency, a framework is a great tool that will help us succeed in that. Of course we are aware that nowadays the initial requirements of a system may change a lot during the development cycle, so any kind of restriction,like implementation rules that help consistency, might not favor extensibility, that’s why many big companies avoid using any kind of framework that will enforce a specific way of working or technology stack and they pick only the ones that are highly extensible and well established.Τεκμήριο Elastic Scaling for Apache Kafka with deep reinforcement learning(01/05/2021) Giannakopoulos, Athanasios; Γιαννακόπουλος, Αθανάσιος; Athens University of Economics and Business, Department of Informatics; Xylomenos, George; Voulgaris, Spyridon; Kalogeraki, VanaIn cloud computing, Elastic Scaling is defined as the ability of a system to dynamically handle changes in workload by adding or removing computing or networking infrastructure. In general, Elasticity allows a cluster to allocate computer resources, based on user’s specific demands. In our current work we used Kafka, which is a high-throughput, low-latency plat-form for handling real-time data feeds, as the underlying system and incorporated elasticity control over it. Kafka, up to now, does not support automatic expansion or decommission of the cluster so we came up with an algorithm based on the round-robin technique in order to make the Scaling Up or Down of the cluster possible. Then, we used two different Deep Reinforcement Learning Approaches in order to learn the optimal elasticity behaviour based on variations of predefined user demands. Deep Reinforcement Learning (Deep RL) is a sub-field of machine learning that combines Reinforcement Learning with Deep Learning and it is particularly useful when the number of possible states are infinite, as it is in our case. The Deep Reinforcement Learning Agents take as input the state of the Kafka cluster at defined timesteps, which is a Multi-dimensional vector consisting of different system metrics, and outputs a Scaling action. We support three Scaling actions. Scale Up: when adding a Broker to the Kafka Cluster, Scale Down: when removing a Broker from the Kafka Cluster and No Scaling: where the Kafka Cluster Operates as it is. Both Agents managed to converge to the optimal elastic policy after a finite amount of steps. More specifically, we used Deep Q Network, Double Deep Q Network architectures and compared their performance. We used Docker to develop and run our application. Every critical component in our implementation is running on a separate docker container. Together all docker containers operate as part of a cluster. This way Docker gives us the opportunity to simulate a real time environment. We used Docker Swarm as the tool to manage and scale our application across different physical machines.Τεκμήριο Evaluating actions in sports analytics using deep learning(01/05/2021) Klagkos, Dimitrios; Κλάγκος, Δημήτριος; Athens University of Economics and Business, Department of Informatics; Androutsopoulos, Ion; Gunopoulos, Dimitrios; Kalogeraki, VanaOver the recent decades, Sports Analytics has developed into an intriguing and challenging task in the research community. Sports is a way for people to pass their time pleasantly and relieve their stress and anxiety, often caused by their everyday routines. One important component that all sports events have in common is the uncertainty that the sports match provide and cause excitement and curiosity to those who observe it. From a scientific point of view, the researchers want to quantify this uncertainty through models and probabilities in order to predict and explain events. So, Sports Analytics is a field with many interesting aspects to investigate such as injuries, evaluation of actions and predictions of outcomes of a sport match. In this paper, we address the problem of the evaluation of actions of players in a football match. We propose models based on Deep Learning, including Fully Convolutional Neural Networks, Long Short Term Models and the combination of them using preprocessing steps and regularization techniques to make more robust predictions for the unseen data. Our experimental evaluation illustrates the working and benefits of our approach.Τεκμήριο Fast and efficient predictions in Big Data systems(13-12-2023) Μαρούλης, Ευστάθιος; Maroulis, Stathis; Athens University of Economics and Business, Department of Informatics; Xylomenos, George; Gunopulos, Dimitrios; Voulgaris, Spyridon; Kotidis, Υannis; Stamoulis, Georgios; Hadjiefthymiades, Stathes; Kalogeraki, VanaΤην τελευταία δεκαετία, η έκρηξη στην παραγωγή δεδομένων από πηγές όπως τα social media, τα κινητά τηλέφωνα και τα δίκτυα αισθητήρων έχει ωθήσει την ανάπτυξη εφαρμογών που απαιτούν πολλά δεδομένα, συμπεριλαμβανομένων των συστημάτων συστάσεων και της πρόβλεψης κυκλοφοριακών μοτίβων. Αυτές οι εφαρμογές, που χειρίζονται δεδομένα σε κλίμακα GB ή TB, απαιτούν σημαντικούς υπολογιστικούς πόρους.Τα κατανεμημένα συστήματα επεξεργασίας μεγάλων δεδομένων όπως τα Apache Spark και Apache Flink είναι κρίσιμα στην επεξεργασία αυτών των τεράστιων όγκων δεδομένων. Ωστόσο, η βελτιστοποίηση αυτών των συστημάτων για αποτελεσματική λειτουργία των εφαρμογών και η ελαχιστοποίηση της κατανάλωσης ενέργειάς τους παρουσιάζει σημαντικές προκλήσεις. Σε αυτή την διατριβή αναπτύχθηκαν πρακτικές μεθοδολογίες για την αντιμετώπιση αυτών των προκλήσεων, εστιάζοντας στον αποδοτικό χρονοπρογραμματισμό (scheduling) εργασιών, στην ανάπτυξη μοντέλων πρόβλεψης υψηλής ακρίβειας, σε συστήματα ανίχνευσης συμβάντων και στην ενεργειακά αποδοτική χρήση πόρων.Η έρευνα αυτή περιλαμβάνει την εξέταση του τομέα του χρονοπρογραμματισμού πραγματικού χρόνου εργασιών σε κατανεμημένα συστήματα επεξεργασίας μεγάλων δεδομένων. Επικεντρώνεται επίσης στη δημιουργία ακριβών μοντέλων για την πρόβλεψη χρόνου εκτέλεσης εφαρμογών, λαμβάνοντας υπόψη τις πολυπλοκότητες όπως η ετερογένεια του περιβάλλοντος εκτέλεσης, οι παραμορφωμένες ενότητες δεδομένων και οι απαιτήσεις των εφαρμογών σε πραγματικό χρόνο, όπως ο χρόνος εκτέλεσης της εφαρμογής. Η προσέγγιση που ακολουθείται περιλαμβάνει την ανάπτυξη καινοτόμων αλγορίθμων χρονοπρογραμματισμού και ενός πρωτοποριακού συστήματος ανάλυσης (profiling). Επιπλέον, αντιμετωπίζει την πρόκληση του χρονοπρογραμματισμού εργασιών με έμφαση στην επίτευξη μετρικών απόδοσης ενώ ταυτόχρονα διαχειρίζονται συντηρητικά οι πόροι και η (ενεργειακή) κατανάλωση του συστήματος. Ένα άλλο σημαντικό επίτευγμα είναι η δημιουργία ενός συστήματος για την πρόβλεψη των μοτίβων κυκλοφορίας στην πόλη του Δουβλίνου, χρησιμοποιώντας τεχνικές Παραγοντοποίησης Πινάκων (Matrix Factorization) και εκμεταλλευόμενοι δεδομένα από αισθητήρες της πόλης. Τέλος, παρουσιάζεται ένα σύστημα που σχεδιάστηκε για την ταχεία και ακριβή παροχή συστάσεων και προβλέψεων στους χρήστες, εκμεταλλευόμενο δεδομένα από το Foursquare και χρησιμοποιώντας τεχνικές Παραγοντοποίησης Τανυστών (Tensor Factorization) για να προτείνει Σημεία Ενδιαφέροντος που προσαρμόζονται στις προτιμήσεις των χρηστών.Οι εμπειρικές αξιολογήσεις σε πραγματικά σύνολα δεδομένων αποδεικνύουν την αποτελεσματικότητα αυτών των μεθοδολογιών στη βελτίωση του χρονοπρογραμματισμού εργασιών, της πρόβλεψης της κυκλοφορίας και των συστημάτων συστάσεων, συμβάλλοντας σημαντικά στην προώθηση των δυνατοτήτων των διανεμημένων συστημάτων επεξεργασίας όπως το Apache Spark και το Apache Flink.Τεκμήριο Installing, removing applications in datacenters and distributing their resources to incoming requestsKakavas, Achilles; Κακάβας, Αχιλλέας; Athens University of Economics and Business, Department of Informatics; Xylomenos, George; Gkritzalis, Dimitrios; Kalogeraki, VanaAlmost every application, which has a back-end part and accepts requests, today is hosted in a datacenter. For example Netflix (Preet Singh & Agarwal, 2013), Zoom (Zoom, 2023) and applications, which process big data, use machine learning and online games are housed in datacenters (Nlyte Software, n.d.). So, there is the necessity of managing the resources of datacenters, in a way that SLO of applications are met and they are utilized to maximum degree. This application offers a solution. By providing a SLO applications can be installed to a server of datacenter reserving an appropriate amount of resources for them. Also, applications can be deleted from servers. When requests for the same application arrive concurrently system allocates resources of application to each request depending on size of individual work server has to complete in order to satisfy them, their cumulative work and available tokens (symbolic resources).Τεκμήριο Load balancing of Apache Kafka distributed streaming system using reinforcement learning techniques(2021) Trogkani, Panagiota; Τρογκάνη, Παναγιώτα; Athens University of Economics and Business, Department of Informatics; Xylomenos, George; Voulgaris, Spyridon; Kalogeraki, VanaThis thesis examines the extent to which a reinforcement learning algorithm could positively a ect the Apache Kafka system, in terms of load balance. Kafkais a stream-processing distributed system that manages a large load of data. During its operation, events may occur that will adversely a ect its performance,such as the shutdown of a machine. But even during a seemingly smooth operation, increased demands can be made on some of its processes, without this being possible to anticipate in advance. Using a reinforcement learning algorithmand speci cally a deep Q-learning algorithm, the possibility of dealing with suchevents is examined, with the prospect that the algorithm will eventually functionas a system administrator, who will select optimal management modes, based onthe current circumstances. Always aiming to maintain the load balance of thesystem, so that it operates at high e ciencies. Contemporary interest is foundin the area of the placement problems and the extent to which reinforcementlearning can lead to optimal solutions.Τεκμήριο Matrix Factorization for Point-of-Interest Recommendation on the user’s route(Athens University of Economics and Business, 02-2015) Μαρούλης, Ευστάθιος; Athens University of Economics and Business, Department of Informatics; Kalogeraki, VanaThesis - Athens University of Economics and Business. Postgraduate in Information systems.Τεκμήριο An online course recommendation system for career paths(12-11-2020) Panagou, Maria; Πανάγου, Μαρία; Athnes University of Economics and Business, Department of Informatics; Koutsopoulos, Iordanis; Kalogeraki, Vana; Voulgaris, SpyridonOnline courses have become extremely popular these days, as more and more universities, institutes and companies are offering online courses available for anyone. These courses provide an affordable and flexible way to learn new skills, advance your career and deliver quality educational experiences at scale. Millions of people around the world enroll to online courses to learn for a variety of reasons including: career development, changing career, college preparation, supplemental learning, lifelong learning, corporate eLearning & training, and more. However, despite the popularity of online education, vast groups of people consciously stay away from such methods, mostly due to the wide variety of courses and the growing number of available online courses. In this context, recommendation systems can play a decisive role in making better and wiser decisions that can affect someone’s future. In this thesis, a proof-of-concept of an online course recommendation system is proposed that aims to improve users’ career readiness by suggesting relevant skills and courses based on their unique career interests.Τεκμήριο Optimizing distributed deep learning through automated batch size tuning(24-10-2024) Νταντάμης, Φοίβος; Dadamis, Phivos; Athens University of Economics and Business, Department of Informatics; Gunopulos, Dimitrios; Gkritzalis, Dimitrios; Kalogeraki, VanaΗ ταχεία πρόοδος των µοντέλων βαϑιάς µάϑησης τα τελευταία χρόνια έχει οδηγήσει σε σηµαντιϰή πρόοδο σε διάφορους τοµείς όπως η όραση υπολογιστή ϰαι η αναγνώριση οµιλίας. Ωστόσο, ϰαϑώς αυτά τα µοντέλα γίνονται πιο πολύπλοϰα ϰαι απαιτούν ολοένα ϰαι µεγαλύτερους υπολογιστιϰούς πόρους όπως υπολογιστιϰή ισχύ ϰαι µνήµη. Τα ϰατανεµηµένα συστήµατα βαϑιάς µάϑησης έχουν εµφανιστεί για να αντιµετωπίσουν αυτές τις προϰλήσεις, αξιοποιώντας τεχνιϰές παραλληλισµού πολλών συσϰευών, όπως ο παραλληλισµός δεδοµένων ϰαι ο παραλληλισµός αγωγών. Αυτή η διατριβή εστιάζει στον παραλληλισµό αγωγών, ο οποίος διαχωρίζει βαϑιά νευρωνιϰά δίϰτυα σε πολλαπλές συσϰευές για να βελτιώσει την επεϰτασιµότητα ϰαι να µειώσει τον χρόνο εϰπαίδευσης. Σε αυτήν την εργασία, προτείνουµε το OptiBatch, έναν προσαρµοστιϰό βελτιστοποιητή διοχέτευσης µε επίγνωση µνήµης που προσαρµόζει δυναµιϰά τις παραµέτρους εϰπαίδευσης, όπως τα µεγέϑη mini-batch ϰαι micro-batch, ως απόϰριση στη χρήση της µνήµης σε πραγµατιϰό χρόνο σε όλες τις συσϰευές. ∆ιεξάγοντας πειράµατα σε ευρέως χρησιµοποιούµενα µοντέλα, ResNet18 ϰαι VGG11, ϰαι σε σύνολα δεδοµένων, MNIST ϰαι CIFAR-10, διερευνούµε τους συµβιβασµούς µεταξύ της ϰατανάλωσης µνήµης, του χρόνου εϰτέλεσης ϰαι της ϰατάτµησης µοντέλων. Η προσέγγισή µας χρησιµοποιεί τη βελτιστοποίηση Pareto για να εξισορροπήσει τη χρήση της µνήµης ϰαι τον χρόνο εϰτέλεσης, διασφαλίζοντας αποτελεσµατιϰή χρήση πόρων ϰάτω από διαφορετιϰές συνϑήϰες συστήµατος. Τα αποτελέσµατα ϰαταδειϰνύουν ότι η δυναµιϰή προσαρµογή παραµέτρων ενισχύει σηµαντιϰά την αποτελεσµατιϰότητα της εϰπαίδευσης, προσφέροντας πληροφορίες για τους επαγγελµατίες που εργάζονται σε µεγάλης ϰλίµαϰας ϰατανεµηµένη βαϑιά µάϑηση. Αυτή η προσαρµοστιϰή λύση παρέχει ένα πλαίσιο για την υπέρβαση των περιορισµών της µνήµης, διατηρώντας παράλληλα τη βέλτιστη απόδοση στην εϰπαίδευση µοντέλων βαϑιάς µάϑησης.Τεκμήριο Positive correlations between campaigns for influence maximization(09-12-2022) Αλχίρχ, Πάντια-Μαρίνα; Alchirch, Pantia-Marina; Athens University of Economics and Business, Department of Informatics; Markakis, Evangelos; Toumpis, Stavros; Kalogeraki, VanaΔιαφημιστικές και πολιτικές καμπάνιες χρησιμοποιούνται ευρέως στα Μέσα Κοινωνικής Δικτύωσης με στόχο να επηρεάσουν τους χρήστες αυτών των πλατφορμών στο να αγοράσουν τα προϊόντα τους ή να υιοθετήσουν τις πολιτικές τους ιδέες και στάσεις. Αυτές οι καμπάνιες συχνά μοιράζονται μια πληθώρα χαρακτηριστικών, όπως το ίδιο κοινό που έχουν ως στόχο ως προς την ηλικία, το φύλο και τις προτιμήσεις. Σε αυτή την διατριβή, εκμεταλλευόμαστε αυτά τα κοινά χαρακτηριστικά και προσπαθούμε να βρούμε πιθανές συσχετίσεις, οι οποίες εντέλει θα βοηθήσουν στη μεγιστοποίηση της επιρροής που ασκούν αυτές οι καμπάνιες στο κοινό. Γι’ αυτό, υλοποιήσαμε έναν εκθετικό μηχανισμό που βρίσκει τα καλύτερα υποσύνολα από καμπάνιες όσον αφορά τις συχετίσεις μεταξύ τους, ενώ παράλληλα εκτελούμε μια διαδικασία εύρεσης πολλαπλών χρηστών. Ο όρος ”πολλαπλών” εδώ αναφέρεται στο γεγονός ότι επιλέγουμε έναν αριθμό n από υποψήφιους διάσημους χρήστες, όπου ο αριθμός n, έχει ήδη προέλθει από τον αριθμό των πιθανών υποσυνόλων από καμπάνιες. Ο αριθμός n είναι αποτέλεσμα του μηχανισμού της συσχέτισης των καμπανιών. Ακόμα, υλοποιούμε έναν μηχανισμό που μιμείται το Minimum Set Cover πρόβλημα, με σκοπό να αναθέσουμε κάθε υποσύνολο από καμπάνιες στον πιο κατάλληλο υποψήφιο, σύμφωνα με τα κοινά τους χαρακτηριστικά καθώς και ενός δοθέντος προϋπολογισμού B. Συνεπώς, ασχολούμαστε με το πρόβλημα της Μεγιστοποίησης της Επιρροής σε ένα περιβάλλον με πολλαπλές καμπάνιες και πολλαπλούς χρήστες και παρουσιάζουμε τα πειραματικά μας αποτελέσματα.Τεκμήριο Resource management in big data processing systems(05/15/2019) Kostopoulos, Victor Efstathios; Athens University of Economics and Business, Department of Informatics; Apostolopoulos, Theodoros; Kalogeraki, VanaThis thesis is involved with a big data processing framework, Apache Spark, referring to some similar software, like Apache Storm and Apache Flink, as well as their comparison.First of all, the term memory elasticity will be introduced, followed by its different approaches, and some techniques and ways of achieving it.Furthermore, an Apache Spark management application will be implemented, where two different processes will be run, a Spark and a Spark Streaming process, whereas nodes will be added or removed automatically depending to the general performance and the resources availability.Finally, some comparison tests will be run to inspect the system’s performance while executing a job and some of its characteristics change, like the number of working nodes, the memory of each node, or the persistence level, in an effoΤεκμήριο Resource management in serverless environments(06/29/2021) Lakka, Alexandra; Λάκκα, Αλεξάνδρα; Athens University of Economics and Business, Department of Informatics; Voulgaris, Spyridon; Xylomenos, George; Kalogeraki, VanaRecently, many choose to take advantage of the capabilities and the services the cloud offers.Compared to the traditional approach, meaning setting up and maintaining the hardware,the cloud offers to take care all of the above, saving, that way, effort and money.The cloud presents different services, such as PaaS, which provides the hardware and theenvironment for an application to run and SaaS, which gives the users access to a cloudapplication. Another service that has emerged the past few years is FaaS, which allows thedevelopers to run their application in the form of functions, while the cloud infrastructuremanages the allocation of the necessary resources for the execution, in environments likeVMs or containers.However, it should be noted that FaaS has its limitations when it comes to optimizingits resource usage. While there are algorithms that can take care of the provisioning ofresources to the running jobs, there is demand for more eficiency, since over-provisioningor under-provisioning are common cases.The promise of serverless computing has attracted the interest of researchers and theaforementioned limitations have sparked a plethora of different approaches, to introduceimprovement.One way to do so is to look into new ways that resource management can be achieved incontainerized environments. One popular approach that has started gaining traction is theuse of Machine Learning algorithms, to make predictions of the resources the differentrunning jobs need. This way the resources can be handed out according to demand and,even, change dynamically.Taking into consideration the possibilities for betterment in this area and the current trends,the present thesis aims to use the cgroups mechanism, alongside an algorithmic approach for allocation, in order to propose an appropriate approach for resource management incontainers, by taking into consideration the specifics of the function we want to run.Τεκμήριο Resource management methods for microservices in cloud environments(06-02-2025) Αργυρίου, Νικόλαος; Argyriou, Nikolaos; Athens University of Economics and Business, Department of Informatics; Xylomenos, George; Gkritzalis, Dimitrios; Kalogeraki, VanaΣε αυτή τη διπλωματική εργασία, εξετάζουμε την επεκτασιμότητα και την βελτιστοποίηση της απόδοσης μιας αρχιτεκτονικής βασισμένης σε μικροϋπηρεσίες υπό διαφορετικά φορτία. Μέσα από διαφορετικά πειράματα σε μια εφαρμογή που αφορά σύστημα κρατήσεων ξενοδοχείων, αξιολογούμε την επίδραση στρατηγικών κλιμάκωσης υπηρεσιών και βάσεων δεδομένων σε βασικούς δείκτες απόδοσης, όπως ο μέσος χρόνος απόκρισης, η τυπική απόκλιση και ο μέγιστος χρόνος απόκρισης. Χρησιμοποιώντας εργαλεία αναφοράς όπως το wrk2 για τη δημιουργία κίνησης, αναλύουμε τα προβλήματα απόδοσης και εντοπίζουμε κρίσιμες υπηρεσίες, όπως οι μικροϋπηρεσίες γεωγραφικής τοποθεσίας και προτιμήσεων, που συνεισφέρουν σημαντικά στην συμπεριφορά του συστήματος. Πειράματα κλιμάκωσης με μεταβαλλόμενους αριθμούς αντιγράφων δείχνουν μετρήσιμες βελτιώσεις στους χρόνους απόκρισης και την απόδοση, καταλήγοντας σε μια στρατηγική κλιμάκωσης που εξασφαλίζει υψηλή σταθερότητα και βέλτιστη απόδοση του συστήματος. Αυτή η εργασία παρέχει χρήσιμα συμπεράσματα για τη βελτιστοποίηση μικροϋπηρεσιών και τον σχεδιασμό επεκτάσιμων συστημάτων για σύγχρονες κατανεμημένες εφαρμογές.Τεκμήριο Route optimization for waste collectors in smart citiesΣπίνος, Αλκιβιάδης; Spinos, Alkiviadis; Athens University of Economics and Business, Department of Informatics; Dimakis, Antonios; Kalogeraki, VanaΜε τη βελτίωση της τεχνολογίας, κατέστη δυνατό να υπάρχουν περισσότερες λύσεις με στόχο τη βελτίωση της ζωής των πολιτών. Ο στόχος των έξυπνων πόλεων είναι να χρησιμοποιούν αυτές τις τεχνολογίες για την επίλυση προβλημάτων που σχετίζονται με την οικονομία, την κατανάλωση ενέργειας και την ευημερία των πολιτών. Μία από τις πτυχές που πρέπει να αντιμετωπίσουν αυτές οι έξυπνες λύσεις είναι η μείωση των εκπομπών αερίων και του κόστους λειτουργίας των απορριμματοφόρων. Χρησιμοποιώντας αισθητήρες, μπορούμε να αναβαθμίσουμε τους κάδους απορριμμάτων για να παρακολουθούμε και να ελέγχουμε την αναλογία πληρότητας του κάδου και να στέλνονται τα δεδομένα σε έναν κεντρικό διακομιστή. Ο κεντρικός διακομιστής θα χρησιμοποιεί μηχανική εκμάθηση (ML) για να υπολογίσει πότε ο κάδος θα γεμίσει και σχεδιάζει την πιο αποτελεσματική διαδρομή. Τέλος ενημερώνει τους απορριμματοσυλλέκτες και εκτελούν τα προγραμματισμένα δρομολόγια. Ο στόχος αυτής της έρευνας είναι να παρέχει μια εύκολη, βήμα προς βήμα εξήγηση της «έξυπνης διαχείρισης απορριμμάτων» και να δημιουργήσουμε έναν αλγόριθμο που υπολογίζει την πιο αποτελεσματική διαδρομήΤεκμήριο A semi-supervised anomaly detection and classification approach in computer vision(04/15/2021) Stefanou, Alexandros; Στεφάνου, Αλέξανδρος; Athnes University of Economics and Business, Department of Informatics; Polyzos, George; Androutsopoulos, Ion; Kalogeraki, VanaThis thesis proposes a hybrid approach for detecting, localizing and classifying anomaliesin video streams from a static camera. The framework we present that is based on thisidea uses a deep learning model for object detection and a dense optical flow method formotion monitoring. Both of these mechanism are running independently in order to detectanomalies and specify their type or description. A transformation step is also applied inthe video stream in order to convert each frame into smaller sized blocks that improve thecomputational efficiency and memory usage. Anomalous blocks are backtracked in theiroriginal frame and location of the present anomaly.The training process learns the normal behavioural parameters of the video stream that areused in the testing phase. The main idea is the novelty detection approach where anomalycan be defined as a previously unseen event. Under this assumption each mechanism usesa custom setup to detect an anomaly.We present in detail the environment we use for testing and examine the time of executionof the framework, which can also be used for real time applications.Τεκμήριο Serverless video analytics platform(29-09-2023) Πατσιλίβας, Ανδρέας; Xylomenos, George; Kalogeraki, VanaΗ ψηφιακή εποχή έχει δημιουργήσει μια ραγδαία αύξηση δεδομένων. Ένας τομέας που έχει δημιουργηθεί για την επεξεργασία όλα αυτών, είναι η ανάλυση μεγάλων δεδομένων. Ο συγκεκριμένος κλάδος παρέχει λύσεις και πληροφορίες για διάφορους επιχειρηματικούς τομείς, συμπεριλαμβανομένων των επιχειρήσεων, των κρατικών λειτουργιών κ.λπ. Ωστόσο, η ανάλυση αυτών των δεδομένων μπορεί να είναι δύσκολη και οι παραδοσιακές μέθοδοι που χρησιμοποιούνται είναι συχνά δαπανηρές και χρονοβόρες. Επιπλέον, η ανάλυση βίντεο γίνεται συνεχώς όλο και πιο σημαντική, επιτρέποντας στους οργανισμούς να εξάγουν πολύτιμες πληροφορίες από πηγές οπτικών δεδομένων όπως κάμερες παρακολούθησης, drones κ.λπ.Για την αντιμετώπιση αυτών των προκλήσεων και συγκεκριμένα στην ανάλυση βίντεο, προτείνεται μια serverless πλατφόρμα ανάλυσης βίντεο, η οποία στοχεύει στην ανάπτυξη μιας πλατφόρμας ανάλυσης βίντεο χρησιμοποιώντας εργαλεία ανοιχτού κώδικα. Αξιοποιώντας τη serverless αρχιτεκτονική, η πλατφόρμα προσφέρει επεκτασιμότητα, οικονομική αποδοτικότητα και ευελιξία. Επιπλέον, λόγω της επιλογής containerized αρχιτεκτονικής, η πλατφόρμα επιπλέον προσφέρει απομόνωση και φορητότητα, ωστόσο παρουσιάζει ιδιαιτερότητές ενορχήστρωσης και ασφαλείας.Η προτεινόμενη πλατφόρμα ανάλυσης βίντεο χρησιμοποιεί τις τεχνολογίες OpenFaaS, Python, OpenCV, YOLO και MinIO για την αυτοματοποίηση της ανάλυσης βίντεο. Η αρχιτεκτονική έχει σχεδιαστεί για προσαρμοστικότητα και επεκτασιμότητα. Οι αξιολογήσεις επιλεγμένων σεναρίων πραγματικού κόσμου αποκάλυψαν την αποτελεσματικότητα της πλατφόρμας, ακόμη και χωρίς υποστήριξη καρτών γραφικών (GPU). Η πλατφόρμα υπόσχεται ανάλυση βίντεο σε πραγματικό χρόνο σε serverless περιβάλλοντα, με περιθώρια βελτίωσης μέσω της υποστήριξης GPU και βελτιστοποιήσεων.Τέλος, αυτή η εργασία δημιούργησε με επιτυχία μια serverless πλατφόρμα ανάλυσης βίντεο χρησιμοποιώντας εργαλεία ανοιχτού κώδικα, αποδεικνύοντας την αποτελεσματικότητά της σε σενάρια πραγματικού κόσμου. Η προσαρμοστικότητά της και οι δυνατότητες διαχείρισης πόρων, καθιστούν την πλατφόρμα μια πολλά υποσχόμενη επιλογή για εφαρμογές ανάλυσης βίντεο, αναδεικνύοντας τις δυνατότητες των serverless αρχιτεκτονικών στην ανάλυση βίντεο. Η πλατφόρμα έχει τη δυνατότητα να φέρει μια καινοτόμα υλοποίηση στον κόσμο της ανάλυσης βίντεο παρέχοντας μια οικονομικά αποδοτική, επεκτάσιμη και προσαρμόσιμη λύση.Τεκμήριο Urban data analytics and applications in the Big Data era(23-03-2023) Τομαράς, Δημήτριος; Tomaras, Dimitrios; Athens University of Economics and Business, Department of Informatics; Vassalos, Vasilios; Xylomenos, George; Stamoulis, Georgios; Voulgaris, Spyridon; Chrysanthis, Panos; Papapetrou, Panagiotis; Kalogeraki, VanaΤα τελευταία χρόνια παρατηρούμε τόσο τη μεγάλη εξάπλωση των έξυπνων συσκευών όσο και τη μεγάλη έλευση του Διαδικτύου των Πραγμάτων ως τη βάση πάνω στην οποία αναπτύσσονται πολυάριθμες έξυπνες εφαρμογές και υπηρεσίες με γνώμονα την επίλυση διαφόρων προβλημάτων μέσα στις πόλεις. Η πληθώρα των διαθέσιμων πηγών δεδομένων έχει προσφέρει μια σειρά σημαντικών επιλογών για την παρακολούθηση και την αξιολόγηση της κατάστασης μιας έξυπνης πόλης σε πραγματικό χρόνο. Το πρώτο μέρος της διατριβής ασχολείται με την ανάλυση και τη μοντελοποίηση των αστικών δεδομένων μελετώντας διάφορες πηγές τέτοιων δεδομένων, είτε εξετάζοντας τα δεδομένα μονομερώς είτε συνδυάζοντας πολλαπλές πηγές δεδομένων ταυτόχρονα. Προτείνονται μετρικές και τεχνικές που εξυπηρετούν την μοντελοποίηση της συμπεριφοράς τους βάσει των χαρακτηριστικών τους, και εν συνεχεία επιτρέπουν περαιτέρω συνδυασμό πολλαπλών πηγών αστικών δεδομένων δημιουργώντας συνέργειες μεταξύ τους. Λαμβάνοντας υπόψιν τις προκλήσεις που προκύπτουν από τα διαφορετικά χαρακτηριστικά των πηγών δεδομένων, στο πρώτο μέρος προτείνεται ένα σύνολο μεθοδολογιών που επιτρέπουν στον κάθε ενδιαφερόμενο να κατανοήσει τον παλμό του αστικού περιβάλλοντος σε πραγματικό χρόνο καθώς και να εξάγει σημαντικά συμπεράσματα από τα δεδομένα που συλλέγονται.Το δεύτερο μέρος της διατριβής επικεντρώνεται στο πρόβλημα της αξιοποίησης των συμπερασμάτων που έχουν προκύψει από τα αστικά δεδομένα καθώς και τη μοντελοποίησή τους και στοχεύει στο να αναδείξει την αξία τους σε εφαρμογές και συστήματα που τα χρησιμοποιού. Σε αυτό το μέρος της διατριβής, προτείνεται ένα σύνολο νέων αλγορίθμων και εφαρμογών που αξιοποιούν την ανάλυση και τη μοντελοποίηση των αστικών δεδομένων καθώς και τα συμπεράσματα που έχουν προκύψει μέσω αυτών, με στόχο την αντιμετώπιση πραγματικών προβλημάτων μέσα σε μια έξυπνη πόλη. Αυτό το μέρος της διατριβής περιλαμβάνει αλγορίθμους γράφων για προβλήματα εκχώρησης πόρων μέσα σε οποιαδήποτε δίκτυα μεταφορών, αλγορίθμους δρομολόγησης μέσα σε γράφους με δυναμικά βάρη, καθώς και τεχνικές που αφορούν την ιδιωτικότητα των δεδομένων από χρήστες υπηρεσιών ανάλυσης δεδομένων.