ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη
Συλλογές :

Τίτλος :Συνδεδεμένα δεδομένα
Εναλλακτικός τίτλος :Linked data
Δημιουργός :Βαγγελάτος, Παναγιώτης
Συντελεστής :Κωνσταντόπουλος, Πάνος (Επιβλέπων καθηγητής)
Παπαθεοδώρου, Χρήστος (Εξεταστής)
Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής (Degree granting institution)
Τύπος :Text
Φυσική περιγραφή :76σ.
Γλώσσα :el
Περίληψη :Ο όρος Συνδεδεμένα Δεδομένα (Linked Data) επινοήθηκε το 2006 από τον Tim Berners Lee. Αναφέρεται σε ένα σύνολο κανόνων και πρακτικών για τη σύνδεση και δημοσίευση δεδομένων στον Παγκόσμιο Ιστό κι αποτελεί συνέχεια και προαπαιτούμενο για την υλοποίηση του ευρύτερου οράματος του Σημασιολογικού Ιστού, που πρωτοπαρουσιάστηκε από τον ίδιο το 1998 [1]. Στην εργασία αυτή κάνουμε μία ανασκόπηση του πεδίου που καλύπτει ο όρος. Αρχίζουμε με μία σύντομη περιγραφή της έννοιας του Σημασιολογικού Ιστού, τον αναμενόμενο τρόπο λειτουργίας του, τα μέσα υλοποίησης του και τα προβλήματα που πρέπει να λυθούν. Στη συνέχεια δίνουμε τον ορισμό και περιγράφουμε τις αρχές και τις απαιτήσεις των Συνδεδεμένων Δεδομένων που έχουν ως στόχο την επίτευξη της συντακτικής και σημασιολογικής διαλειτουργικότητας. Ξεκινάμε με τις στοιχειώδεις έννοιες του Resource Description Framework (RDF) , Universal Resource Identifiers και τους συνδέσμους. Παρουσιάζουμε τους ορισμούς και τις παραλλαγές τους. Ακολούθως περνάμε στην περιγραφή των εργαλείων που είναι απαραίτητα για την υλοποίηση της σημασιολογικής σύνδεσης και συνένωσης δεδομένων: SKOS, RDFS, OWL. Οι βασικότερες προκλήσεις των Συνδεδεμένων Δεδομένων, αφού έχουν ορισθεί οι κανόνες και τα πλαίσια δημιουργίας είναι η δημιουργία αυτών καθαυτών των δεδομένων. Στα επόμενα κεφάλαια ασχολούμαστε με τη δημιουργία των συνδέσμων και τις τεχνικές κι εργαλεία που χρησιμοποιούνται κι αμέσως μετά παρουσιάζουμε τους τρόπους δημοσίευσης των συνδεδεμένων δεδομένων και τους τρόπους λήψης αυτών. Ορίζουμε και διακρίνουμε τα Ανοικτά Συνδεδεμένα Δεδομένα και κάνουμε μία σύντομη παρουσίαση της εξέλιξης και σημερινής κατάστασής τους με αριθμούς. Ένας από τους σημαντικότερους παράγοντες αποδοχής κι επιτυχίας ενός πληροφοριακού συστήματος είναι η ποιότητα της πληροφορίας που δίνει. Ο ορισμός της ποιότητας από μόνος του έχει πολλές πλευρές (ορθότητα, ακρίβεια, συνέπεια κλπ). Εξετάζουμε το τι σημαίνει ποιότητα στα Συνδεδεμένα Δεδομένα πώς μπορεί να εξασφαλιστεί καθώς και παράγοντες που επηρεάζουν θετικά ή αρνητικά την ποιότητα. Τα Συνδεδεμένα Δεδομένα δημιουργούν έναν τεράστιο όγκο δεδομένων από τη μία μεριά ενώ μπορούν επίσης να περιέχουν ένα ακόμα μεγαλύτερο όγκο πληροφοριών που θα πρέπει να αναλυθεί ποσοτικά. Το πρόβλημα της ανάλυσης μεγάλου όγκου δεδομένων των παραδοσιακών συστημάτων συναλλαγών (transactional), έχει λυθεί με τις αποθήκες δεδομένων (datawarehouses) και τα συστήματα On-Line Analytical Processing. Στο τελευταίο κεφάλαιο εξετάζουμε πώς από ένα dataset Συνδεδεμένων Δεδομένων Στατιστικής σε RDF μπορεί να δημιουργηθεί ένα μοντέλο OLAP αλλά και πως επηρεάζονται οι αποθήκες δεδομένων από τα Συνδεδεμένα Δεδομένα.
The term Linked Data was coined by Tim Berners Lee in 2006 and refers to the principles and guidelines for publishing and connecting semi-structured data on the Web, in a way that data is machine-readable. Linked Data is part of the technology stack that W3C is building to support the Semantic Web: a Web of data from various sources, that machines can collect, process, make inferences to help humans give answers to complex queries. In this paper we make an overall review of Linked Data. We start with a short description of the concept “Semantic Web”, the expectations and the problems that should be addressed. In chapter 2 we present the principles and rules of the Linked Data. The desired interoperability of systems, which is the foundation of the Semantic Web, can be achieved by standardizing the ways the systems exchange information. In chapters 3 and 4 we describe the means for achieving the syntactic and semantic interoperability: RDF, URIs, metadata, RDFS, SKOS, OWL, Ontology alignment, data linking. We also review the proposals found in the bibliography, to tackle one of the most common and difficult problems in data linking: co-reference. In the next two chapters we present the ways of publishing and consuming Linked Data. In chapter 7 we make a quick reference on the Linked Open Data their features and their statistics. The adoption of the Linked Data depends very much on the volume and the quality of the data that will be me made available. The aspects of quality and known errors are presented in chapter 8. The Linked Data - the principles, the tools and data themselves – bring new challenges in the data analysis field. The problem of the analysis of big volume of data in the transactional systems has been solved with data warehouses and On-Line Analytical Processing Systems. In chapter 10 we see if and how these can be used for the analysis of the Linked Data and what is the impact of Linked data on DW and OLAP.
Λέξη κλειδί :Συνδεδεμένα δεδομένα
Διαλειτουργικότητα
Ανοιχτά δεδομένα
Linked data
Interoperability
Open data
Ημερομηνία έκδοσης :31-12-2012
Άδεια χρήσης :

Αρχείο: Vaggelatos_2012.pdf

Τύπος: application/pdf