Abstract : | Η εργασία αυτή μελετάει τα πλεονεκτήματα στην απόδοση των ομότιμων (Peer-to-Peer) δικτύων που προκύπτουν από την χρήση Hierarchical Distributed Hash Tables (H-DHT) έναντι των Distributed Hash Tables (DHT). Τα DHT είναι βασικό κομμάτι των ομότιμων δικτύων καθώς είναι υπεύθυνα για την δρομολόγηση των αιτημάτων, την αποθήκευση και το διαμερισμό των δεδομένων στους κόμβους του δικτύου. Οι H-DHT αναδιαμορφώνουν την επίπεδη δομή των DHT σε ιεραρχική, επιδιώκοντας πλεονεκτήματα όπως η απομόνωση σφαλμάτων, η αποτελεσματική προσωρινή αποθήκευση δεδομένων, η μαζική αποστολή αιτημάτων που προσφέρονται από τα χαρακτηριστικά της ιεραρχικής δομής, διατηρώντας παράλληλα τα πλεονεκτήματα της επίπεδης δομής όπως η ανοχή στα σφάλματα και η ομοιόμορφη κατανομή του φόρτου των αιτημάτων. Το πρώτο μέρος της εργασίας ερευνά και αξιολογεί τα αποτελέσματα διαφορετικών μεθόδων ομαδοποίησης (clustering) με βάση ένα σύνολο δεδομένων με χρόνους απόκρισης κόμβων του διαδικτύου. Σκοπός των αλγόριθμων ομαδοποίησης είναι να χωρίσουν τους κόμβους σε ομάδες ώστε να ελαχιστοποιείται ο χρόνος απόκρισης μεταξύ των κόμβων της ομάδας. Δείκτες όπως το μέσο μέγεθος ομάδας και η τυπική απόκλιση του μεγέθους των ομάδων χρησιμοποιούνται για την αξιολόγηση της ποιότητας τηε ομαδοποίησης. Το δεύτερο μέρος της εργασίας μελετά το Hierarchical Kademlia (H-Kademlia). To Kademlia είναι ένα από τα πλέον γνωστά DHT καθώς χρησιμοποιείται για τον διαμερισμό αρχείων, την λειτουργία αλυσίδων καταχώρισης και την αποθήκευση περιεχομένου σε αποκεντρωμένα συστήματα. Το H-Kademlia αποτελεί μια υλοποίηση της Kademlia βάση του προτύπου σχεδιασμού Canon, που περιγράφει ένα τρόπο μετατροπής της επίπεδης τοπολογίας δικτύου σε ιεραρχική. Τέλος, χρησιμοποιείται ο προσομοιωτής λειτουργίας ομότιμων δικτύων PeerNet για να αξιολογηθεί η απόδοση του H-Kademlia στους διαφορετικούς τύπους ομαδοποίησης των κόμβων που παρήχθησαν στο πρώτο μέρος της εργασίας. Η αξιολόγηση της απόδοσης του δικτύου εστιάζει στο χρόνο απόκρισης και τον αριθμό των βημάτων που χρειάζεται ένας κόμβος για ένα εντοπίσει ή να αποθηκεύσει μια τιμή στο δίκτυο. Η αξιολόγηση χρησιμοποιεί ως βάση την απόδοση του «επίπεδου» Kademlia και εξετάζει τις διαφορές στην απόδοση του H-Kademlia που προκύπτουν από τους διαφορετικούς τύπους ομαδοποίησης. This study explores the potential improvements in network performance that Hierarchical Distributed Hash Tables (H-DHT) could offer compared to Distributed Hash Tables (DHTs). DHTs serve as vital components in numerous peer-to-peer (P2P) systems, fulfilling crucial functions like routing, data storage, and data dissemination. Moreover, hierarchical DHTs modify the traditional structure by introducing advantages such as fault isolation, effective caching, request aggregation while retaining key benefits found in flat topologies, such as load balancing and fault tolerance. Our investigation initially evaluates the performance of some popular clustering algorithms on a real-world scenario, using a latency dataset of internet endpoints. The objective is to partition the network into several clusters while minimizing the intra-cluster latency. Metrics such as average cluster size, cluster size deviation, and cluster count has been considered to assess the clustering quality of the algorithms. Then, a dedicated study of Hierarchical Kademlia (H-Kademlia) is conducted. Kademlia is a widely known DHT, used in various decentralized applications, including file sharing systems, blockchain networks, and distributed storage platforms. H-Kademlia is a novel implementation of vanilla Kademlia constructed according to the Canon paradigm, a design pattern proposed to convert a flat DHT into a hierarchical one. Finally, utilizing a PeerNet P2P network simulator the impact of Hierarchical Kademlia in various node grouping scenarios, as generated by the initial phase of our study, is evaluated. The evaluation involves a comparison of network performance, focusing on factors such as latency and the number of hops needed for a node to either locate a key or store a value. This comparison spans different clustering configurations and is contrasted with the performance of the standard Kademlia protocol.
|
---|