Συλλογές
Τίτλος Πολλαπλές βάσεις δεδομένων στην εποχή των big data
Εναλλακτικός τίτλος Multiple databases in the era of big data
Δημιουργός Καλογεράς, Παύλος
Συντελεστής Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας
Κορφιάτης, Νικόλαος
Μούρτος, Ιωάννης
Χατζηαντωνίου, Δαμιανός
Τύπος Text
Φυσική περιγραφή 96σ.
Γλώσσα el
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9128
Περίληψη The purpose of this thesis is the presentation and examination of an emerging and promising approach in the field of Big Data and Data Integration, through a system category which is mentioned by the literature as Federated Database Management Systems. In particular, this dissertation focuses on a subcategory of those systems, known as Polystores, concerning an alternative management technology of a sheer volume of data, which are derived from hetero-geneous data sources, in contrast to more traditional techniques such as Data Warehouse mod-els. In order to fulfill the purpose of this dissertation, the BigDAWG was utilized, which con-stitutes an open source polystore application. This application offers heterogeneous data man-agement solutions by making use of a single interface, thus enabling users to process data in their native model.The contribution of this thesis extends to the presentation of a methodology referring to the importing of user’s data to the heterogeneous storage engines constituting the BigDAWG. The code of the application was properly reconfigured, while for data representation purposes, there was a case study exhibition regarding Smart Grid technology. In the last part of this study, some preliminary experiments of benchmarking were conducted, the findings of whom showcased the advantages of this application, but also the need for further improvement.
Ο σκοπός της παρούσας διπλωματικής εργασίας είναι η παρουσίαση και ανάλυση μίας αναδυ-όμενης και πολλά υποσχόμενης προσέγγισης στον τομέα των Μεγάλων Δεδομένων (Big Data) και της ενσωμάτωσης αυτών (Data Integration), μέσα από μία κατηγορία συστημάτων τα οποία αναφέρονται από την βιβλιογραφία ως Ενοποιημένα Συστήματα Διαχείρισης Βάσεων Δεδομένων (Federated Database Management Systems). Ειδικότερα, η εργασία εστιάζει σε μία υποκατηγορία των συστημάτων αυτών, με την ονομασία Polystores, η οποία αφορά μία εναλλακτική τεχνολογία διαχείρισης μεγάλων όγκων δεδομένων που προέρχονται από ετερο-γενείς πηγές, σε σχέση με πιο παραδοσιακές τεχνικές όπως είναι το μοντέλο της Αποθήκης Δεδομένων (Data Warehouse). Για την επίτευξη του σκοπού της εργασίας, αξιοποιήθηκε το Bigdawg, που αποτελεί μία polystore εφαρμογή ανοικτού κώδικα. Αυτή η εφαρμογή προσφέ-ρει λύσεις διαχείρισης ετερογενών δεδομένων μέσα από μία ενιαία διεπαφή (Interface), που δίνει τη δυνατότητα στους χρήστες να επεξεργαστούν δεδομένα στο μητρικό τους μοντέλο.Η συμβολή της εργασίας επεκτείνεται στην παρουσίαση μίας μεθοδολογίας εκχώρησης των δεδομένων του χρήστη στις ετερογενείς μηχανές αποθήκευσης που απαρτίζουν το BigDAWG. Ο κώδικας της εφαρμογής παραμετροποιήθηκε καταλλήλως, ενώ για την αναπαράσταση των δεδομένων παρουσιάστηκε ένα σενάριο μελέτης περίπτωσης σχετικό με την τεχνολογία των Έξυπνων Δικτύων (Smart Grids). Στο τελευταίο μέρος της εργασίας, διενεργήθηκαν προκα-ταρκτικά πειράματα συγκριτικής αξιολόγησης του polystore συστήματος, τα ευρήματα των ο-ποίων ανέδειξαν χρήσιμα πλεονεκτήματα της εφαρμογής, αλλά και την ανάγκη για περαιτέρω βελτιώσεις.
Λέξη κλειδί Ετερογένεια
Big data
Ενσωμάτωση δεδομένων
Μεγάλα δεδομένα
Data integration
Heterogeneity
Polystores
BigDAWG
Διαθέσιμο από 2022-02-05 12:40:43
Ημερομηνία έκδοσης 02/03/2022
Ημερομηνία κατάθεσης 2022-02-05 12:40:43
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/