Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Στατιστικής / Department of Statistics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Genome-wide insights: biclustering approaches for mining gene expression data

Εναλλακτικός τίτλος :	Πληροφορίες για όλο το γονιδίωμα: προσεγγίσεις δι-ομαδοποίησης για την εξόρυξη δεδομένων γονιδιακής έκφρασης

Δημιουργός :	Παπαδάκη, Βασιλική Papadaki, Vasiliki

Συντελεστής :	Papageorgiou, Ioulia (Επιβλέπων καθηγητής) Papastamoulis, Panagiotis (Εξεταστής) Pedeli, Xanthi (Εξεταστής) Athens University of Economics and Business, Department of Statistics (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	129p.

Γλώσσα :	en

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11528

Περίληψη :	Η δι-ομαδοποίηση (Biclustering) έχει αναδειχθεί ως μια ισχυρή επέκταση της παραδοσιακής ομαδοποίησης (Clustering), επιτρέποντας την ταυτόχρονη ομαδοποίηση γραμμών και στηλών σε πίνακες δεδομένων, αποκαλύπτοντας κρυμμένα μοτίβα και παρέχοντας πολύτιμες πληροφορίες. Αυτή η διατριβή εξερευνά την εξέλιξη και την εφαρμογή των τεχνικών δι-ομαδοποίησης που αναπτύχθηκαν την τελευταία δεκαετία, με έμφαση στις θεωρητικές βάσεις και τις πρακτικές τους εφαρμογές. Εξετάζουμε διάφορους αλγορίθμους δι-ομαδοποίησης, συμπεριλαμβανομένων των αλγορίθμων Cheng και Church (CCA), Iterative Signature Algorithm (ISA), Plaid Model, xMOTIFs και Bimax, για την αξιολόγηση της απόδοσης και της υπολογιστικής τους αποδοτικότητας. Η μελέτη χρησιμοποιεί τον Δείκτη Jaccard για τη σύγκριση της ομοιότητας των αποτελεσμάτων της δι-ομαδοποίησης, υπογραμμίζοντας τη σημασία της προσεκτικής επιλογής αλγορίθμων. Πρακτικά παραδείγματα χρησιμοποιώντας R (R commander) δείχνουν την εφαρμογή αυτών των αλγορίθμων, ενώ βασικές τεχνικές απεικόνισης όπως θερμοχάρτες και διμερή ή τρισδιάστατα γραφήματα κατανομής στο χώρο εικονογραφούν τα αποτελέσματα. Τα ευρήματα υπογραμμίζουν τη σημασία της επιλογής κατάλληλων αλγορίθμων βάσει των χαρακτηριστικών του συνόλου δεδομένων και προτείνουν τη δυνατότητα μελλοντικών βελτιώσεων μέσω υβριδικών προσεγγίσεων. Αυτή η έρευνα συμβάλλει στην βαθύτερη κατανόηση των τεχνικών δι-ομαδοποίησης και των εφαρμογών τους, ανοίγοντας το δρόμο για περαιτέρω καινοτομίες στη βιοπληροφορική και σε άλλους τομείς. Biclustering has emerged as a powerful extension of traditional clustering, allowing for simultaneous clustering of rows and columns in data matrices to uncover hidden patterns and provide valuable insights. This thesis explores the evolution and application of biclustering techniques developed over the last decade, with a focus on their theoretical foundations and practical implementations. We examine various biclustering algorithms, including the Cheng and Church Algorithm (CC), Iterative Signature Algorithm (ISA), Plaid Model, xMOTIFs, and Bimax, to evaluate their performance and computational efficiency, while at the same time there is a lot of theoretical reference included in this research. Later on, the study employs the Jaccard Index to compare the similarity of biclustering results, highlighting the importance of careful algorithm selection. Practical examples using R (R commander) demonstrate the implementation of these algorithms, and key visualization techniques such as heatmaps and bipartite graphs or 3-D distributional plots are employed to illustrate the results. The findings underscore the importance of selecting appropriate algorithms based on dataset characteristics and highlight the potential for future advancements through similar biclustering approaches. This research contributes to a deeper understanding of biclustering techniques and their applications, paving the way for further innovations in bioinformatics and other fields.

Περίληψη :

Η δι-ομαδοποίηση (Biclustering) έχει αναδειχθεί ως μια ισχυρή επέκταση της παραδοσιακής ομαδοποίησης (Clustering), επιτρέποντας την ταυτόχρονη ομαδοποίηση γραμμών και στηλών σε πίνακες δεδομένων, αποκαλύπτοντας κρυμμένα μοτίβα και παρέχοντας πολύτιμες πληροφορίες. Αυτή η διατριβή εξερευνά την εξέλιξη και την εφαρμογή των τεχνικών δι-ομαδοποίησης που αναπτύχθηκαν την τελευταία δεκαετία, με έμφαση στις θεωρητικές βάσεις και τις πρακτικές τους εφαρμογές. Εξετάζουμε διάφορους αλγορίθμους δι-ομαδοποίησης, συμπεριλαμβανομένων των αλγορίθμων Cheng και Church (CCA), Iterative Signature Algorithm (ISA), Plaid Model, xMOTIFs και Bimax, για την αξιολόγηση της απόδοσης και της υπολογιστικής τους αποδοτικότητας. Η μελέτη χρησιμοποιεί τον Δείκτη Jaccard για τη σύγκριση της ομοιότητας των αποτελεσμάτων της δι-ομαδοποίησης, υπογραμμίζοντας τη σημασία της προσεκτικής επιλογής αλγορίθμων. Πρακτικά παραδείγματα χρησιμοποιώντας R (R commander) δείχνουν την εφαρμογή αυτών των αλγορίθμων, ενώ βασικές τεχνικές απεικόνισης όπως θερμοχάρτες και διμερή ή τρισδιάστατα γραφήματα κατανομής στο χώρο εικονογραφούν τα αποτελέσματα. Τα ευρήματα υπογραμμίζουν τη σημασία της επιλογής κατάλληλων αλγορίθμων βάσει των χαρακτηριστικών του συνόλου δεδομένων και προτείνουν τη δυνατότητα μελλοντικών βελτιώσεων μέσω υβριδικών προσεγγίσεων. Αυτή η έρευνα συμβάλλει στην βαθύτερη κατανόηση των τεχνικών δι-ομαδοποίησης και των εφαρμογών τους, ανοίγοντας το δρόμο για περαιτέρω καινοτομίες στη βιοπληροφορική και σε άλλους τομείς.
Biclustering has emerged as a powerful extension of traditional clustering, allowing for simultaneous clustering of rows and columns in data matrices to uncover hidden patterns and provide valuable insights. This thesis explores the evolution and application of biclustering techniques developed over the last decade, with a focus on their theoretical foundations and practical implementations. We examine various biclustering algorithms, including the Cheng and Church Algorithm (CC), Iterative Signature Algorithm (ISA), Plaid Model, xMOTIFs, and Bimax, to evaluate their performance and computational efficiency, while at the same time there is a lot of theoretical reference included in this research. Later on, the study employs the Jaccard Index to compare the similarity of biclustering results, highlighting the importance of careful algorithm selection. Practical examples using R (R commander) demonstrate the implementation of these algorithms, and key visualization techniques such as heatmaps and bipartite graphs or 3-D distributional plots are employed to illustrate the results. The findings underscore the importance of selecting appropriate algorithms based on dataset characteristics and highlight the potential for future advancements through similar biclustering approaches. This research contributes to a deeper understanding of biclustering techniques and their applications, paving the way for further innovations in bioinformatics and other fields.

Λέξη κλειδί :	Δι-ομαδοποίηση Ομαδοποίηση Γονίδια Ανάλυση δεδομένων Αλγόριθμος Biclustering Clustering Genes Data analysis Algorithm

Διαθέσιμο από :	2024-10-07 01:49:59

Ημερομηνία έκδοσης :	24-09-2024

Ημερομηνία κατάθεσης :	2024-10-07 01:49:59

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Papadaki_2024.pdf

Τύπος: application/pdf

Είσοδος