PYXIDA Institutional Repository
and Digital Library
 Home
Collections :

Title :Genome-wide insights: biclustering approaches for mining gene expression data
Alternative Title :Πληροφορίες για όλο το γονιδίωμα: προσεγγίσεις δι-ομαδοποίησης για την εξόρυξη δεδομένων γονιδιακής έκφρασης
Creator :Παπαδάκη, Βασιλική
Papadaki, Vasiliki
Contributor :Papageorgiou, Ioulia (Επιβλέπων καθηγητής)
Papastamoulis, Panagiotis (Εξεταστής)
Pedeli, Xanthi (Εξεταστής)
Athens University of Economics and Business, Department of Statistics (Degree granting institution)
Type :Text
Extent :129p.
Language :en
Identifier :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11528
Abstract :Η δι-ομαδοποίηση (Biclustering) έχει αναδειχθεί ως μια ισχυρή επέκταση της παραδοσιακής ομαδοποίησης (Clustering), επιτρέποντας την ταυτόχρονη ομαδοποίηση γραμμών και στηλών σε πίνακες δεδομένων, αποκαλύπτοντας κρυμμένα μοτίβα και παρέχοντας πολύτιμες πληροφορίες. Αυτή η διατριβή εξερευνά την εξέλιξη και την εφαρμογή των τεχνικών δι-ομαδοποίησης που αναπτύχθηκαν την τελευταία δεκαετία, με έμφαση στις θεωρητικές βάσεις και τις πρακτικές τους εφαρμογές. Εξετάζουμε διάφορους αλγορίθμους δι-ομαδοποίησης, συμπεριλαμβανομένων των αλγορίθμων Cheng και Church (CCA), Iterative Signature Algorithm (ISA), Plaid Model, xMOTIFs και Bimax, για την αξιολόγηση της απόδοσης και της υπολογιστικής τους αποδοτικότητας. Η μελέτη χρησιμοποιεί τον Δείκτη Jaccard για τη σύγκριση της ομοιότητας των αποτελεσμάτων της δι-ομαδοποίησης, υπογραμμίζοντας τη σημασία της προσεκτικής επιλογής αλγορίθμων. Πρακτικά παραδείγματα χρησιμοποιώντας R (R commander) δείχνουν την εφαρμογή αυτών των αλγορίθμων, ενώ βασικές τεχνικές απεικόνισης όπως θερμοχάρτες και διμερή ή τρισδιάστατα γραφήματα κατανομής στο χώρο εικονογραφούν τα αποτελέσματα. Τα ευρήματα υπογραμμίζουν τη σημασία της επιλογής κατάλληλων αλγορίθμων βάσει των χαρακτηριστικών του συνόλου δεδομένων και προτείνουν τη δυνατότητα μελλοντικών βελτιώσεων μέσω υβριδικών προσεγγίσεων. Αυτή η έρευνα συμβάλλει στην βαθύτερη κατανόηση των τεχνικών δι-ομαδοποίησης και των εφαρμογών τους, ανοίγοντας το δρόμο για περαιτέρω καινοτομίες στη βιοπληροφορική και σε άλλους τομείς.
Biclustering has emerged as a powerful extension of traditional clustering, allowing for simultaneous clustering of rows and columns in data matrices to uncover hidden patterns and provide valuable insights. This thesis explores the evolution and application of biclustering techniques developed over the last decade, with a focus on their theoretical foundations and practical implementations. We examine various biclustering algorithms, including the Cheng and Church Algorithm (CC), Iterative Signature Algorithm (ISA), Plaid Model, xMOTIFs, and Bimax, to evaluate their performance and computational efficiency, while at the same time there is a lot of theoretical reference included in this research. Later on, the study employs the Jaccard Index to compare the similarity of biclustering results, highlighting the importance of careful algorithm selection. Practical examples using R (R commander) demonstrate the implementation of these algorithms, and key visualization techniques such as heatmaps and bipartite graphs or 3-D distributional plots are employed to illustrate the results. The findings underscore the importance of selecting appropriate algorithms based on dataset characteristics and highlight the potential for future advancements through similar biclustering approaches. This research contributes to a deeper understanding of biclustering techniques and their applications, paving the way for further innovations in bioinformatics and other fields.
Subject :Δι-ομαδοποίηση
Ομαδοποίηση
Γονίδια
Ανάλυση δεδομένων
Αλγόριθμος
Biclustering
Clustering
Genes
Data analysis
Algorithm
Date Available :2024-10-07 01:49:59
Date Issued :24-09-2024
Date Submitted :2024-10-07 01:49:59
Access Rights :Free access
Licence :

File: Papadaki_2024.pdf

Type: application/pdf