Περίληψη : | Piping and Instrumentation Diagrams (P&IDs) are schematic representations of equipment, pipelines, instrumentation, and control systems. They appear in process environments, such as Oil Refineries, Chemical Plants, Paper Mills, and Cement Plants, etc. The identification of each element constituting a P&ID, along with the way they are interconnected, is an important task that has not been automated yet. In this work we study a methodology and develop the respective algorithm towards the identification of these components. This identification aims to the classification of the elements based on their representation as images as well as to the identification and translation of the codes included in the diagrams.In order to achieve this goal a combination of methods are employed. Using the OpenCV library the outlines of the P&ID are calculated. An algorithm is developed, which based on the coordinates of the outlines, delivers snapshots of the elements constituting the P&ID. In the sequel, these elements are classified by a suitably designed classifier, to one out of 53 classes. The classifier is a convolutional neural network (CNN), implemented using the TensorFlow and Keras libraries, which was trained on a data set of 2970 images that belong to one out of 53 classes.Textual information contained in the P&ID are identified, using the pytesseract library and stored into an array. Then, they are passed to an algorithm that implements the ANSI/ISA-5.1.-1984 (R1992) standards and deciphers the textual tags, by providing as output the name, function, modifier etc. of each element. The model is able to successfully identify an image and attribute it to the right class, which is a great step towards solving the challenging problem of the identification of the elements constituting a P&ID.cPiping and Instrumentation Diagrams (P&IDs) are schematic representations of equipment, pipelines, instrumentation, and control systems. They appear in process environments, such as Oil Refineries, Chemical Plants, Paper Mills, and Cement Plants, etc. The identification of each element constituting a P&ID, along with the way they are interconnected, is an important task that has not been automated yet. In this work we study a methodology and develop the respective algorithm towards the identification of these components. This identification aims to the classification of the elements based on their representation as images as well as to the identification and translation of the codes included in the diagrams.In order to achieve this goal a combination of methods are employed. Using the OpenCV library the outlines of the P&ID are calculated. An algorithm is developed, which based on the coordinates of the outlines, delivers snapshots of the elements constituting the P&ID. In the sequel, these elements are classified by a suitably designed classifier, to one out of 53 classes. The classifier is a convolutional neural network (CNN), implemented using the TensorFlow and Keras libraries, which was trained on a data set of 2970 images that belong to one out of 53 classes.Textual information contained in the P&ID are identified, using the pytesseract library and stored into an array. Then, they are passed to an algorithm that implements the ANSI/ISA-5.1.-1984 (R1992) standards and deciphers the textual tags, by providing as output the name, function, modifier etc. of each element. The model is able to successfully identify an image and attribute it to the right class, which is a great step towards solving the challenging problem of the identification of the elements constituting a P&ID. Τα σχέδια σωληνώσεων και οργάνων (P&ID) είναι σχηματικές απεικονίσεις εξοπλισμού, σωληνώσεων, οργάνων και συστημάτων ελέγχου. Εμφανίζονται σε εγκαταστάσεις διεργασιών όπως Διυλιστήρια, Χημικά Εργοστάσια, Χαρτοποιεία και Τσιμεντοβιομηχανίες κ.λπ. Η αναγνώριση κάθε στοιχείου που συνιστά ένα τέτοιο σχέδιο, καθώς και η συνδεσμολογία αυτών μεταξύ τους, είναι κάτι πολύ σημαντικό που δεν έχει μέχρι σήμερα αυτοματοποιηθεί. Σε αυτή την εργασία προτείνουμε μια μεθοδολογία και αναπτύσσουμε τον αντίστοιχο κώδικα για την αναγνώριση αυτών των στοιχείων. Αυτή η ταυτοποίηση στοχεύει στην ταξινόμηση των στοιχείων με βάση την αναπαράστασή τους ως εικόνες καθώς και στην αναγνώριση και μετάφραση των κωδικών που περιλαμβάνονται στα σχέδια.Για την επίτευξη αυτού του στόχου χρησιμοποιείτε ένας συνδυασμός μεθόδων. Χρησιμοποιώντας τη βιβλιοθήκη OpenCV υπολογίζονται το περίγραμμα του κάθε στοιχείου επί του σχεδίου. Αναπτύσσουμε ένας αλγόριθμος, ο οποίος με βάση τις συντεταγμένες που παρέχονται από τα περιγράμματα, δημιουργεί στιγμιότυπα των στοιχείων αυτών. Στην συνέχεια, αυτά τα στοιχεία κατηγοριοποιούνται από έναν κατάλληλα σχεδιασμένο ταξινομητή, σε μια από 53 κλάσεις. Ο ταξινομητής είναι ένα Συνελικτικό Νευρωνικό Δίκτυο, που υλοποιείτα με τη χρήση των βιβλιοθηκών TensorFlow και Keras, το οποίο εκπαιδεύουμε σε ένα σύνολο δεδομένων 2970 εικόνων που ανήκουν σε 53 τάξεις. Οι πληροφορίες κειμένου που περιέχονται στο σχέδιο σωληνώσεων και οργάνων αναγνωρίζονται με τη χρήση της βιβλιοθήκης pytesseract και αποθηκεύονται σε έναν πίνακα. Στη συνέχεια, εφαρμόζουμε σε αυτά έναν αλγόριθμο που υλοποιεί τα πρότυπα ANSI/ISA-5.1.-1984 (R1992) και αποκρυπτογραφεί τις ετικέτες κειμένου, παρέχοντας ως αποτέλεσμα το όνομα, τη συνάρτηση, τον τροποποιητή κ.λπ. κάθε στοιχείου.Το πρόγραμμα που αναπτύσσουμε επιτυγχάνει να ταυτοποιήσει ένα στοιχείο ενός P&ID και να το αποδόσει στην ορθή κλάση, γεγονός που αποτελεί ένα πρώτο ελπιδοφόρο βήμα προς την επίλυση του πολύ απαιτητικού προβλήματος της αναγνώσης στοιχείων ενός P&ID.
|
---|