Pandas Εμφάνιση μέγιστων σειρών

Pandas Emphanise Megiston Seiron



Τα πάντα είναι από τα πιο δημοφιλή εργαλεία που χρησιμοποιούνται σήμερα από τους επιστήμονες δεδομένων για την ανάλυση δεδομένων σε πίνακα. Για την αντιμετώπιση του περιεχομένου σε πίνακα, προσφέρει ένα πιο γρήγορο και αποτελεσματικό API. Κάθε φορά που προβάλλουμε πλαίσια δεδομένων κατά την ανάλυση, το Pandas ορίζει αυτόματα διάφορες συμπεριφορές εμφάνισης σε προεπιλεγμένες τιμές. Αυτές οι συμπεριφορές εμφάνισης περιλαμβάνουν πόσες σειρές και στήλες θα εμφανιστούν, την ακρίβεια των αιωρήσεων σε κάθε πλαίσιο δεδομένων, τα μεγέθη στηλών κ.λπ.  Ανάλογα με τις απαιτήσεις, μπορεί περιστασιακά να χρειαστεί να τροποποιήσουμε αυτές τις προεπιλογές. Τα panda έχουν μια ποικιλία προσεγγίσεων για την αλλαγή της προεπιλεγμένης συμπεριφοράς. Η αξιοποίηση του χαρακτηριστικού 'options' των panda μας επέτρεψε να αλλάξουμε αυτή τη συμπεριφορά.

Τα Panda εμφανίζουν μέγιστες σειρές

Κάθε φορά που προσπαθείτε να εκτυπώσετε ένα τεράστιο πλαίσιο δεδομένων που περιέχει περισσότερες σειρές και στήλες από το προκαθορισμένο όριο, η έξοδος θα περικοπεί. Για να εμφανίσετε όλες τις σειρές στο DataFrame, θα μάθετε πώς να τροποποιείτε τις επιλογές εμφάνισης των Panda σε αυτό το σεμινάριο. Τα Panda από προεπιλογή επιβάλλουν ένα όριο στον αριθμό των στηλών και των γραμμών που εμφανίζει. Αν και αυτό μπορεί να είναι χρήσιμο για την ανάγνωση περιεχομένου, προκαλεί συχνά απογοήτευση εάν δεν εμφανίζονται οι πληροφορίες που θέλετε να προβάλετε. Εδώ, θα χρησιμοποιήσουμε τις μεθόδους που δίνονται παρακάτω με τη σύνταξή τους για να εμφανίσουμε όλες τις στήλες του πλαισίου δεδομένων.







to_string()





set_option()





option_context()



Θα μάθουμε τη χρήση όλων αυτών των μεθόδων με πρακτική εφαρμογή για την εμφάνιση μέγιστων σειρών στο παρεχόμενο πλαίσιο δεδομένων.

Παράδειγμα # 1: Χρήση της μεθόδου Pandas to_string().

Αυτή η επίδειξη θα μας διδάξει να εμφανίζουμε μέγιστες σειρές σε ένα πλαίσιο δεδομένων στο τερματικό χρησιμοποιώντας τη μέθοδο pandas 'to_string()'.

Για τη μεταγλώττιση και την εκτέλεση των δειγμάτων προγραμμάτων, επιλέξαμε το εργαλείο «Spyder». Σε αυτόν τον οδηγό, θα χρησιμοποιήσουμε αυτό το εργαλείο για την εκτέλεση όλων των παραδειγμάτων μας. Ξεκινήσαμε το εργαλείο 'Spyder' για να ξεκινήσουμε τη συγγραφή του σεναρίου για python. Ξεκινώντας με τον κώδικα, πρέπει πρώτα να φορτώσουμε τις απαραίτητες βιβλιοθήκες στο αρχείο μας python, ώστε να μας επιτραπεί να χρησιμοποιήσουμε τις δυνατότητές του. Η βιβλιοθήκη μονάδων που χρειαζόμαστε εδώ είναι τα 'Pandas'. Έτσι, το εισαγάγαμε στο αρχείο μας python και το ονομάσαμε 'pd'.

Καθώς η κύρια λειτουργία αυτού του άρθρου είναι να εμφανίσει τις μέγιστες σειρές ενός πλαισίου δεδομένων, χρειαζόμαστε πρώτα ένα πλαίσιο δεδομένων. Τώρα εξαρτάται από εσάς εάν προτιμάτε να δημιουργήσετε ένα πλαίσιο δεδομένων ή να εισαγάγετε ένα αρχείο CSV. Έχουμε εισαγάγει ένα δείγμα αρχείου CSV. Για την ανάγνωση ενός αρχείου CSV στο πρόγραμμα python, χρησιμοποιήσαμε τη συνάρτηση pandas “pd.read_csv()”. Ανάμεσα στις παρενθέσεις αυτής της συνάρτησης, έχουμε παράσχει το αρχείο CSV που θέλουμε να διαβάσουμε στην οθόνη, το οποίο είναι 'industry.csv'. Κατασκευάσαμε μια μεταβλητή 'df' για την αποθήκευση της εξόδου που δημιουργείται από την ανάγνωση του παρεχόμενου αρχείου CSV. Στη συνέχεια, χρησιμοποιήσαμε τη μέθοδο 'print()' για να εμφανίσουμε το πλαίσιο δεδομένων.

Όταν εκτελούμε αυτό το πρόγραμμα python πατώντας την επιλογή 'Εκτέλεση αρχείου', εμφανίζεται ένα πλαίσιο δεδομένων στην κονσόλα. Μπορείτε να παρατηρήσετε ότι υπάρχουν 43 σειρές στο αποτέλεσμα παρακάτω, αλλά εμφανίζονται μόνο δέκα. Αυτό συμβαίνει επειδή η προεπιλεγμένη τιμή της βιβλιοθήκης Pandas είναι μόνο 10 σειρές.

Θα χρησιμοποιήσουμε τη μέθοδο pandas 'to_string' για να εμφανίσουμε όλες τις σειρές εδώ. Ο πιο απλός τρόπος για να εμφανίσετε μέγιστες σειρές από ένα πλαίσιο δεδομένων είναι με αυτήν την τεχνική. Ωστόσο, δεδομένου ότι μετατρέπει το πλήρες πλαίσιο δεδομένων σε μια ενιαία συμβολοσειρά, δεν συνιστάται για πολύ μεγάλα σύνολα δεδομένων (σε εκατομμύρια). Ωστόσο, αυτό λειτουργεί αποτελεσματικά για σύνολα δεδομένων που έχουν μήκος χιλιάδων.

Ακολουθήσαμε τη σύνταξη που παρέχεται παραπάνω για τη συνάρτηση 'to_string()'. Απλώς καλέσαμε τη μέθοδο 'to_string()' με το όνομα του πλαισίου δεδομένων μας. Στη συνέχεια, τοποθετήσαμε αυτή τη μέθοδο στη συνάρτηση 'print()' για να την εμφανίσουμε όταν καλείται.

Το στιγμιότυπο εξόδου μας δείχνει ένα πλαίσιο δεδομένων με όλες τις σειρές να εμφανίζονται στο τερματικό.

Παράδειγμα # 2: Χρήση της μεθόδου set_option Pandas

Η δεύτερη μέθοδος που θα εξασκήσουμε σε αυτόν τον οδηγό είναι τα panda 'set_option()' για την εμφάνιση των μέγιστων σειρών του παρεχόμενου πλαισίου δεδομένων.

Στο αρχείο python, έχουμε εισαγάγει τη βιβλιοθήκη pandas για πρόσβαση στην προαναφερθείσα συνάρτηση. Χρησιμοποιήσαμε τα panda 'pd.read_csv()' για να διαβάσουμε το παρεχόμενο αρχείο CSV. Επικαλέσαμε τη συνάρτηση “pd.read_CSV()” με το όνομα του αρχείου CSV που θέλουμε να χρησιμοποιήσουμε ανάμεσα στις παρενθέσεις του που είναι “Sampledata.csv”. Κατά την εισαγωγή του αρχείου CSV, έχετε υπόψη τον τρέχοντα κατάλογο εργασίας του προγράμματος Python. Το αρχείο CSV σας πρέπει να τοποθετηθεί στον ίδιο κατάλογο. Διαφορετικά, θα λάβετε ένα μήνυμα σφάλματος 'το αρχείο δεν βρέθηκε'. Έχουμε δημιουργήσει μια μεταβλητή 'δείγμα' για την αποθήκευση του πλαισίου δεδομένων από το αρχείο CSV. Καλέσαμε τη μέθοδο 'print()' για να εμφανίσουμε αυτό το πλαίσιο δεδομένων.

Εδώ, έχουμε την έξοδο μας όπου εμφανίζονται μόνο δέκα σειρές. Ο μέγιστος αριθμός σειρών που υποδεικνύεται είναι 99. Όλες οι άλλες σειρές μεταξύ των πρώτων 5 και των τελευταίων πέντε σειρών είναι περικομμένες.

Για να εμφανίσουμε τις μέγιστες σειρές που είναι 99 για αυτό το πλαίσιο δεδομένων, θα χρησιμοποιήσουμε τη συνάρτηση 'set_option()' της μονάδας pandas. Τα Panda διαθέτουν ένα λειτουργικό σύστημα που σας επιτρέπει να αλλάξετε τη συμπεριφορά και την εμφάνιση. Αυτή η μέθοδος μας δίνει τη δυνατότητα να ρυθμίσουμε την οθόνη να εμφανίζει ένα πλήρες πλαίσιο δεδομένων και όχι ένα περικομμένο. Τα panda παρέχουν τη συνάρτηση 'set_ option()' για την εμφάνιση όλων των σειρών του πλαισίου δεδομένων.

Έχουμε καλέσει το 'pd.set_option()'. Αυτή η συνάρτηση έχει παραμέτρους 'display.max_rows'. Το 'display.max_rows' καθορίζει τον μέγιστο αριθμό σειρών που θα εμφανίζονται κατά την εμφάνιση ενός πλαισίου δεδομένων. Η τιμή του 'max_rows' έχει οριστεί στο 10 από προεπιλογή. Εάν έχει επιλεγεί 'Καμία', σημαίνει όλες τις σειρές στο πλαίσιο δεδομένων. Καθώς θέλουμε να εμφανίσουμε όλες τις σειρές, έτσι το ορίζουμε σε 'Καμία'. Τέλος, χρησιμοποιήσαμε τη συνάρτηση 'print()' για να εμφανίσουμε το πλαίσιο δεδομένων με μέγιστες σειρές.

Αυτό αποδίδει το αποτέλεσμα που παρέχεται στο στιγμιότυπο παρακάτω.

Παράδειγμα # 3: Χρήση της μεθόδου Pandas option_context().

Η τελευταία μέθοδος που συζητάμε εδώ είναι η 'option_context()' για την εμφάνιση όλων των σειρών του πλαισίου δεδομένων. Για αυτό, εισαγάγαμε το πακέτο pandas στο αρχείο python και αρχίσαμε να γράφουμε τον κώδικα. Χρησιμοποιήσαμε τη συνάρτηση “pd.read_csv()” για να διαβάσουμε το αρχείο CSV που έχουμε καθορίσει. Δημιουργήσαμε μια μεταβλητή 'dalta' για την αποθήκευση του πλαισίου δεδομένων από το καθορισμένο αρχείο CSV. Στη συνέχεια, απλά εκτυπώσαμε το πλαίσιο δεδομένων με τη μέθοδο “print()”.

Το αποτέλεσμα που λάβαμε από την εκτέλεση του παραπάνω κώδικα μας δείχνει ένα πλαίσιο δεδομένων με περικομμένες σειρές.

Τώρα θα εφαρμόσουμε τα panda 'pd.option_context()' σε αυτό το πλαίσιο δεδομένων. Αυτή η συνάρτηση είναι πανομοιότυπη με την 'set_option()'. Η μόνη διαφορά μεταξύ των δύο προσεγγίσεων είναι ότι το 'set_option()' αλλάζει τις ρυθμίσεις μόνιμα, ενώ το 'option _context()' απλώς τις άλλαξε μέσα στο εύρος του. Αυτή η μέθοδος λαμβάνει επίσης τις σειρές display.max ως παράμετρο, τις οποίες ορίσαμε σε 'Καμία' για απόδοση όλων των σειρών του πλαισίου δεδομένων. Μετά την κλήση αυτής της συνάρτησης, απλώς την εμφανίσαμε μέσω της μεθόδου «print()».

Εδώ, μπορούμε να προβάλουμε το πλήρες πλαίσιο δεδομένων με τις μέγιστες σειρές του που είναι 2747.

συμπέρασμα

Αυτό το άρθρο εστιάζει στις επιλογές εμφάνισης των πάντα. Μερικές φορές μπορεί να χρειαστεί να προβάλουμε το πλήρες πλαίσιο δεδομένων στο τερματικό. Τα πάντα μας δίνουν μια ποικιλία επιλογών για αυτόν τον σκοπό. Σε αυτόν τον οδηγό, χρησιμοποιήσαμε τρεις από αυτές τις στρατηγικές. Το πρώτο παράδειγμα βασίστηκε στη χρήση της μεθόδου 'to_string()'. Το δεύτερο παράδειγμα μας διδάσκει να υλοποιούμε το 'set_option()' ενώ η τελευταία εικόνα εκτελεί τη μέθοδο 'option_context()'. Όλες αυτές οι τεχνικές παρουσιάζονται για να σας εξοικειώσουν με τους εναλλακτικούς τρόπους με τους οποίους τα πάντα μας παρέχουν για να επιτύχουμε το απαιτούμενο αποτέλεσμα.