Pandas Dataframe Unique

Pandas Dataframe Unique



Η πιο δημοφιλής βιβλιοθήκη Python που χρησιμοποιείται στην επιστήμη δεδομένων ονομάζεται Pandas. Προσφέρει στους προγραμματιστές Python εργαλεία υψηλής απόδοσης, φιλικά προς τον χρήστη και ανάλυση δεδομένων. Μόλις κατανοήσετε τις θεμελιώδεις λειτουργίες και πώς να τις χρησιμοποιήσετε, το Pandas είναι ένα ισχυρό εργαλείο για την αλλαγή δεδομένων. Στα 'pandas' οι τυπικές μέθοδοι για την αποθήκευση δεδομένων σε μορφή πίνακα είναι τα DataFrames. Μπορούμε να χρησιμοποιήσουμε ορισμένες μεθόδους 'pandas' για να λάβουμε τις μοναδικές τιμές στη στήλη 'pandas' του DataFrame. Όταν πρέπει να λάβουμε μοναδικές τιμές στις στήλες του DataFrame και δεν θέλουμε διπλασιασμό των τιμών στη στήλη του DataFrame 'pandas', μπορούμε να χρησιμοποιήσουμε τις μεθόδους που παρέχει το 'pandas' για να το κάνουμε αυτό. Ας δούμε τέτοιες μεθόδους σε αυτόν τον οδηγό, μαζί με μερικά παραδείγματα και αποτελέσματα για να λάβουμε μοναδικές τιμές στη στήλη 'pandas' του DataFrame.

Μέθοδοι για τη λήψη μοναδικών τιμών στις στήλες του DataFrame 'pandas'.

Μπορούμε να χρησιμοποιήσουμε δύο μεθόδους για να λάβουμε τις μοναδικές τιμές στις στήλες του DataFrame 'pandas'. Αφαιρούμε τις διπλότυπες τιμές και λαμβάνουμε μόνο τις μοναδικές τιμές στις στήλες των DataFrames. Οι μέθοδοι που παρέχουν τα «πάντα» για να κάνουν αυτήν την εργασία είναι:







  • Χρησιμοποιώντας τη μέθοδο unique().
  • Χρησιμοποιώντας τη μέθοδο drop_dupliactes().

Τώρα, θα χρησιμοποιήσουμε και τις δύο μεθόδους στους κωδικούς 'pandas' για να λάβουμε τις μοναδικές τιμές στις στήλες του DataFrame 'pandas'.



Παράδειγμα #01

Η εφαρμογή 'Spyder' χρησιμοποιείται εδώ για τη δημιουργία αυτών των κωδικών 'pandas' για να χρησιμοποιήσουμε αυτές τις μεθόδους που μας βοηθούν να λάβουμε τις μοναδικές τιμές στις στήλες του DataFrame 'pandas'. Πρέπει να εισαγάγουμε τις μονάδες 'pandas', οι οποίες είναι απαραίτητες για τον κώδικα 'pandas', πριν δημιουργήσουμε το DataFrame. Χρησιμοποιώντας τον όρο 'εισαγωγή' και τοποθετώντας τα 'pandas ως pd', εισάγουμε αυτές τις μονάδες.



Τώρα, με τη βοήθεια του 'pd', μπορούμε να αποκτήσουμε γρήγορα τις συναρτήσεις ή τις μεθόδους 'pandas'. Στη συνέχεια, βάζουμε το 'Subject_data' στο οποίο προσθέτουμε το 'Name' και στο 'Name', προσθέτουμε τα δεδομένα του ονόματος που είναι 'Roman, William, Peter, Smith, John, Milli, Thomas και James'. Στη συνέχεια, προσθέτουμε τα δεδομένα του θέματος στο «Θέμα» που είναι «Μαθηματικά, Οικονομικά, Επιστήμη, Μαθηματικά, Στατιστικά, Στατιστικά, Στατιστικά, και Υπολογιστές». Στη συνέχεια, μετατρέπουμε αυτό το 'Subject_data' στο DataFrame 'Subject_df' χρησιμοποιώντας τη μέθοδο 'pd.DataFrame()'. Τοποθετούμε το 'Subject_df' στη μέθοδο 'print()' ώστε να εμφανίζεται στο τερματικό.





Τώρα, θέλουμε να λάβουμε τις μοναδικές τιμές στη στήλη 'Subj' του DataFrame 'pandas'. Για το σκοπό αυτό, χρησιμοποιούμε τη μέθοδο “unique()” εδώ και προσθέτουμε το όνομα της στήλης και επίσης το όνομα του DataFrame όπως φαίνεται παρακάτω. Προσθέτουμε αυτή τη μέθοδο στο 'print()' έτσι το αποτέλεσμα θα εμφανίζεται και στο τερματικό.



Τώρα, πατάμε το 'Shift+Enter' για να λάβουμε το αποτέλεσμα αυτού του κωδικού και αποδίδεται στο τερματικό και εμφανίζεται επίσης εδώ, το οποίο περιέχει το DataFrame με όλες τις τιμές. Αυτό είναι το αρχικό DataFrame που έχουμε προσθέσει στον κώδικα και κάτω από αυτό εμφανίζει τις μοναδικές τιμές της στήλης 'Subj'. Καταργεί τις διπλότυπες τιμές και εμφανίζει τις μοναδικές τιμές της στήλης 'Subj' του DataFrame.

Παράδειγμα #02

Δημιουργούμε το 'Sample_list' που περιέχει ορισμένες πληροφορίες. Εισάγουμε 'Layla, 21, 28, 31, 14 και 39' που θα εμφανιστεί ως η πρώτη στήλη όταν μετατρέψουμε αυτήν τη λίστα στο DataFrame. Στη συνέχεια, προσθέτουμε 'Lusy, 31, 25, 34, 26 και 21' ως τη δεύτερη σειρά του DataFrame. Μετά από αυτό, έχουμε τα “Peter, 38, 20, 20, 35, και 24” και “Layla 38, 23, 39 24, 23” που θα είναι η τρίτη και η τέταρτη σειρά του DataFrame. Εισάγουμε επίσης τρία ακόμη δεδομένα που είναι «Στέλλα, 21, 24, 24, 28, 31», «Λάιλα, 33, 32, 26, 30, 25» και επίσης «Πέτρος, 21, 21, 31, 21, 29» .

Τώρα, μετατρέπουμε το 'Sample_list' στο 'DF_Sample' που είναι το όνομα του DataFrame εδώ βάζοντας τη συνάρτηση 'pd.DataFrame()'. Επίσης, ορίσαμε το όνομα των στηλών αυτού του DataFrame και αυτά τα ονόματα είναι 'Name, Ass_1, Ass_2, Ass_3, Ass_4 και Ass_5'. Στη συνέχεια, χρησιμοποιούμε το 'print()' που βοηθά στην εμφάνιση του DataFrame 'DF_Sample'. Τώρα, χρησιμοποιούμε μια άλλη μέθοδο σε αυτό το παράδειγμα για να λάβουμε τις μοναδικές τιμές στη στήλη του DataFrame. Αυτή η μέθοδος είναι η μέθοδος 'drop_duplicates()' των 'pandas'.

Στη μέθοδο 'drop_duplicates()', ορίζουμε το όνομα της στήλης όπου θέλουμε να λάβουμε τις μοναδικές τιμές στη στήλη του DataFrame. Λαμβάνουμε μοναδικές τιμές της στήλης 'Όνομα' ρίχνοντας τις διπλότυπες τιμές σε αυτήν τη στήλη με τη βοήθεια της μεθόδου 'drop_duplicates()' και επίσης αποδίδουμε αυτές τις μοναδικές τιμές χρησιμοποιώντας τη συνάρτηση 'print()' εδώ.

Τα ονόματα που είναι διπλότυπα απορρίπτονται και οι μοναδικές τιμές αποδίδονται μετά την εφαρμογή της μεθόδου 'drop_duplicates()'. Μπορείτε να σημειώσετε ότι το όνομα 'Layla' εμφανίζεται σε τρία κελιά της στήλης 'Όνομα'. Αλλά όταν εφαρμόζεται η μέθοδος 'drop_duplicates()' σε αυτήν τη στήλη, όλες οι διπλότυπες τιμές απορρίπτονται και ένα όνομα 'Layla' εμφανίζεται στην οθόνη. Μετά την απόρριψη των διπλότυπων τιμών, εμφανίστηκε το νέο DataFrame που περιέχει τις μοναδικές τιμές σε αυτήν τη στήλη 'Όνομα'. Με αυτόν τον τρόπο, μπορούμε να ρίξουμε τις διπλότυπες τιμές και να λάβουμε τη μοναδική τιμή στη στήλη του DataFrame με τη βοήθεια της μεθόδου 'drop_duplicates()'.

Παράδειγμα #03

Το ίδιο DataFrame χρησιμοποιείται ξανά και τώρα εφαρμόζουμε τη μέθοδο 'unique()' εδώ. Με τη μέθοδο “unique()” τοποθετούμε το όνομα της στήλης καθώς και το όνομα του DataFrame στο οποίο θέλουμε να εφαρμόσουμε αυτή τη μέθοδο “unique()” για να λάβουμε τις μοναδικές τιμές. Αυτό θα αποδώσει μόνο τις μοναδικές τιμές αυτής της στήλης και δεν θα εμφανίσει αυτές τις τιμές με τη μορφή DataFrame.

Εδώ, το DataFrame περιέχει επτά τιμές στη στήλη 'Όνομα', αλλά όταν εφαρμόζουμε τη μέθοδο 'unique()' σε αυτήν τη στήλη, έχουν εμφανιστεί μόνο τέσσερις τιμές και αυτές είναι οι μοναδικές τιμές αυτής της στήλης. Δεν αποδίδει διπλότυπες τιμές.

Παράδειγμα #04

Το DataFrame που δημιουργούμε σε αυτό το παράδειγμα είναι το 'F_G_df'. Εισάγουμε τα 'My_fruits' και 'my_Vegs' σε αυτό το DataFrame. Η στήλη 'My_fruits' περιέχει 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear και Apple'. Στη συνέχεια, έχουμε το 'My_Vegs' που περιέχει τα ονόματα των λαχανικών που είναι 'Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic, and Ginger'. Αυτό το DataFrame περιέχει μόνο δύο στήλες.

Τώρα, λαμβάνουμε τις μοναδικές τιμές και στις δύο στήλες  με τη βοήθεια της μεθόδου 'unique()'. Αναφέρουμε το όνομα του DataFrame. Στη συνέχεια, βάλτε το όνομα της πρώτης στήλης. Μετά από αυτό, χρησιμοποιούμε τη μέθοδο append(). Σε αυτό το παράρτημα, τοποθετούμε ξανά το όνομα του DataFrame και το όνομα της δεύτερης στήλης και τοποθετούμε τη μέθοδο 'unique()'. Αυτό θα λάβει τις μοναδικές τιμές και των δύο στηλών και στη συνέχεια θα προσαρτήσει τις μοναδικές τιμές και των δύο στηλών και θα τις εμφανίσει στην οθόνη.

Το DataFrame αποδίδεται πρώτα με όλες τις τιμές. Μετά από αυτό, εφαρμόζεται η μέθοδος 'unique()' και οι μοναδικές τιμές και των δύο στηλών αποδίδονται παρακάτω. Σε αυτόν τον κώδικα, λαμβάνουμε τις μοναδικές τιμές στις πολλαπλές στήλες του DataFrame χρησιμοποιώντας τη μέθοδο 'unique()'.

συμπέρασμα

Η πλήρης εξήγηση για τη λήψη των μοναδικών τιμών στη στήλη του DataFrame βρίσκεται σε αυτόν τον οδηγό. Έχουμε συζητήσει τις μεθόδους 'unique()' και 'drop_duplicates()' που μας βοηθούν να λάβουμε τις μοναδικές τιμές της στήλης του DataFrame. Εξερευνήσαμε πώς να χρησιμοποιήσουμε αυτές τις μεθόδους στον κώδικα 'pandas' χρησιμοποιώντας αυτές τις μεθόδους εδώ στους κώδικές μας. Έχουμε επεξηγήσει διαφορετικά παραδείγματα σε αυτόν τον οδηγό και σας δείξαμε πώς να λαμβάνετε τις μοναδικές τιμές μιας στήλης χρησιμοποιώντας τη μέθοδο 'unique()' καθώς και τη μέθοδο 'drop_duplicates()'. Εξερευνήσαμε επίσης πώς να λάβουμε τις μοναδικές τιμές σε πολλές στήλες χρησιμοποιώντας τη μέθοδο 'unique()' σε αυτόν τον οδηγό.