PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Σύστημα εξαγωγής on-demand αναφορών σε χωροχρονική βάση δεδομένων
Creator :Ατσιδάκου, Χριστιάνα
Contributor :Βαζιργιάννης, Μιχαήλ (Επιβλέπων καθηγητής)
Καλαμπούκης, Θεόδωρος (Εξεταστής)
Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής (Degree granting institution)
Type :Text
Extent :95σ.
Language :el
Abstract :Η διπλωματική αυτή εργασία και το σύστημα που υλοποιήθηκε στο πλαίσιο αυτής περιλαμβάνει και συνδυάζει δεδομένα διαφορετικών τομέων. Αρχικά όμως να γίνει μια περιγραφή της διπλωματικής και ποιος ήταν ο στόχος προς επίτευξη. Ο μεγάλος όγκος πληροφοριών και η δυναμική φύση του παγκόσμιου ιστού επισημαίνουν τη μεγάλη ανάγκη για συνεχή ενημέρωση web based συστημάτων ανάκτησης. Μέσω των crawlers είναι δυνατή η αυτόματη συλλογή και αποθήκευση ενός μέρους του παγκόσμιου ιστού. Ενώ κάποια συστήματα βασίζονται σε crawlers που συλλέγουν στοιχεία από ολόκληρο τον Παγκόσμιο Ιστό, κάποια άλλα έχουν crawlers που εστιάζουν σε συγκεκριμένες εφαρμογές και θέματα. Ο crawler που υλοποιήθηκε στα πλαίσια της διπλωματικής αυτής συλλέγει αγγελίες ακινήτων του ελλαδικού χώρου από τις μεγαλύτερες ιστοσελίδες φιλοξενίας αγγελιών, αυτοματοποιημένα κάθε 20 ημέρες. Για κάθε μια αγγελία συγκρατούνται τα σημαντικότερα στοιχεία της, στοιχεία που ενδιαφέρουν κυρίως τους χρήστες που αναζητούν αγορά ή ενοικίαση κάποιου ακινήτου. Τέτοια δεδομένα είναι η περιοχή του ακινήτου, η τιμή του, το εμβαδόν του, ο τύπος του, αυτά που κοιτά πρώτα ο κάθε ενδιαφερόμενος. Τα παραπάνω δεδομένα αποθηκεύονται σε μια βάση δεδομένων. Η βάση αυτή αποτελείται από πολλούς πίνακες, μερικοί από τους οποίους μένουν σταθεροί και δεν μεταβάλλονται, όπως ο πίνακας με τα γεωγραφικά διαμερίσματα της Ελλάδος, ενώ άλλοι χρησιμεύουν στην αποθήκευση και συνεχή ανανέωση των αγγελιών. Ο λόγος που συλλέγονται οι αγγελίες, όμως, δεν είναι μόνο για να υπάρχει μια βάση δεδομένων με τις αγγελίες, αλλά επειδή η ανάγκη για μια συγκεντρωτική και διαχρονική εικόνα της αγοράς ακινήτων στον ελλαδικό χώρο. Δημιουργήθηκε λοιπόν, εκ νέου ένας ιστότοπος (www.propertywatch.gr) ο οποίος χρησιμεύει στην προβολή στατιστικών στοιχείων. Οι επισκέπτες της σελίδας έχουν μια ευρεία γκάμα επιλογών σχετικά με τα χαρακτηριστικά των ακινήτων για τα οποία επιθυμεί να προβληθούν στατιστικά. Τα στατιστικά προκύπτουν σε μορφή ραβδογραμμάτων με εμφάνιση φιλική στο χρήστη. Γενικότερα, ολόκληρος ο ιστότοπος έγινε με γνώμονα τη φιλική διεπαφή του χρήστη. Ο στόχος λοιπόν της συγκεκριμένης εργασίας ήταν η σχεδίαση και υλοποίηση ενός ολοκληρωμένου συστήματος συλλογής δεδομένων (crawler), το οποίο βρίσκει εφαρμογή στην ελληνική κτηματομεσιτική αγορά. Ο απώτερος σκοπός της συγκεκριμένης υλοποίησης είναι η συλλογή των αγγελιών, ώστε να εξαχθούν συμπεράσματα και στατιστικά στοιχεία για την εικόνα της αγοράς ακινήτων στον ελλαδικό χώρο. Ακόμη, οι χρήστες της σελίδες έχουν τη δυνατότητα να εισάγουν τη δική τους αγγελία, να τροποποιήσουν ή να διαγράψουν αγγελίες που έχουν εισάγει όπως επίσης και να αναζητήσουν αγγελίες που έχουν εισάγει άλλοι χρήστες. Κύριος στόχος της παρούσας αναφοράς είναι η παρουσίαση και ανάλυση των βασικότερων σημείων του συστήματος, της θεωρίας που μελετήθηκε και των τεχνικών που χρησιμοποιήθηκαν για την υλοποίηση του.
This thesis and the system implemented under this involves combining data from different sectors. Initially, however, let be a description of the thesis and which was the target to be achieved. The large amount of information and the dynamic nature of the Web highlight the great need for continuous web based information retrieval systems. With the assistance of crawlers a fraction of the web can be automatically collected and stored. While some systems rely on crawlers that collect data from around the Web, others have crawlers that focus on specific applications and issues. The crawler implemented in this thesis collects real estate ads of Greece by the largest ads web hosts, through an automated process every 20 days. For each listing the major elements are retained mainly with information of interest to users looking for buying or renting. Such data is the area of the property, its price, lot size, type of, what looks at first that anyone. The above data is stored in a database. This database consists of several tables, some of which remain stable and not altered, as the table with the prefectures of Greece, while others are used to store and continuously update the ads. The reason the ads are collected, however, is not just to have a database of ads, but because of the need for a centralized and enduring image of the real estate market in Greece. So a website was created (www.propertywatch.gr) which serves to show the data in datagram format. The statistics obtain in the form of bar chart appearance with user-friendly appearance. More generally, the whole website was driven user friendly interface. Thus, the goal of this thesis was to design and implement an integrated data collection system (crawler), which finds application in the Greek real estate market. The ultimate goal of this implementation is a collection of ads in order to draw conclusions and statistical data for the situation of the real estate market in Greece. In addition, users of the pages have the opportunity to introduce their own ad, modify or delete ads that have been introduced as well to look for ads that have been entered by other users. The main objective of this report is to present and analyze key points of the system, the theory that had to be studied and the techniques used for implementation.
Subject :Χωροχρονικές βάσεις δεδομένων
Crawlers
Συλλογή δεδομένων
Κτηματομεσιτική αγορά
Date :29-02-2012
Licence :

File: Atsidakou_2012.pdf

Type: application/pdf