PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Popularity and usage of statistical - data science software
Alternative Title :Δημοτικότητα και χρήση λογισμικού στατιστικής - επιστήμης δεδομένων
Creator :Κιρίλλοβ, Κωνσταντίνος
Kirillov, Konstantinos
Contributor :Papastamoulis, Panagiotis (Επιβλέπων καθηγητής)
Pedeli, Xanthi (Εξεταστής)
Karlis, Dimitrios (Εξεταστής)
Athens University of Economics and Business, Department of Statistics (Degree granting institution)
Type :Text
Extent :119p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10006
Abstract :Στόχος αυτής της εργασίας είναι η συλλογή, η παρουσίαση και η ανάλυση της δημοτικότητας των στατιστικών εργαλείων που επιλέχθηκαν στα πλαίσια της έρευνας. Στην αρχή παρουσιάζεται η θεωρία που θα χρησιμοποιηθεί στα επόμενα κεφάλαια. Μετά από αυτό, ακολουθεί μια σύντομη συζήτηση για πώς συλλέχθηκαν τα δεδομένα. Αφού ολοκληρωθεί η συγκέντρωση των δεδομένων, ακολουθεί μια εκτενής ανάλυση του συνόλου δεδομένων και των μεταβλητών του. Στη συνέχεια γίνεται προσπάθεια ομαδοποίησης των συγκεντρωμένων παρατηρήσεις, χρησιμοποιώντας τεχνικές που στοχεύουν στη ομαδοποίηση για δυαδικά δεδομένα. Και τέλος, το σύνολο δεδομένων συλλέγεται ξανά μέσω μιας συτόματης διαδικασίας και τα νέα δεδομένα συγκρίνονται με τα παλιά.
The aim of this thesis is to collect, present and analyze the popularity of the statistical tools chosen, all the while trying to determine whether there are latent relationships between them. At first the theory to be used in the subsequent chapters is presented. After that, comes a brief discussion about how the data was collected. After the aggregation of data is complete, then follows an extensive analysis of the dataset and its variables. Afterwards, there is an attempt at grouping the collected observations, by using techniques aimed at clustering for binary data. And finally, the data set is reconstructed through a web scraping procedure and the new data are compared to the old data that were collected in the beginning of the thesis.
Subject :Δημοτικότητα
Λογισμικό στατιστικής
Επιστήμη δεδομένων
Popularity
Statistical software
Data science
Date Available :2023-02-01 14:59:23
Date Issued :01-02-2023
Date Submitted :2023-02-01 14:59:23
Access Rights :Free access
Licence :

File: Kirillov_2023.pdf

Type: application/pdf