Εκκαθαρίστε το DataFrame στο Pandas

Ekkathariste To Dataframe Sto Pandas



Η αφαίρεση δεδομένων από το Pandas DataFrame πραγματοποιείται χρησιμοποιώντας τη συνάρτηση pandas.DataFrame.drop(). Εκτός από αυτή τη συνάρτηση, μπορούμε να επιλέξουμε τις γραμμές από το DataFrame χωρίς να λάβουμε υπόψη τις στήλες/γραμμές. Αυτό μπορεί επίσης να γίνει χρησιμοποιώντας τις αγκύλες. Σε αυτόν τον οδηγό, θα χρησιμοποιήσουμε επίσης τη λέξη-κλειδί 'del' και τη συνάρτηση pop() για να διαγράψουμε όλες τις σειρές επαναλαμβάνοντας το DataFrame χρησιμοποιώντας έναν βρόχο 'for'.

Χρήση του Pandas.DataFrame.Drop

Χρησιμοποιούμε τη συνάρτηση pandas.DataFrame.drop() για να αποθέσουμε συγκεκριμένες σειρές ή συγκεκριμένες στήλες από το Pandas DataFrame. Ας χρησιμοποιήσουμε αυτή τη συνάρτηση για να απορρίψουμε όλες τις σειρές και τις στήλες.

Σύνταξη :







Ακολουθεί η σύνταξη της συνάρτησης pandas.DataFrame.drop(). Χρησιμοποιούμε μόνο τρεις παραμέτρους και συζητάμε μόνο αυτές τις τρεις σε αυτόν τον οδηγό. Υπάρχει ένα λεπτομερές σεμινάριο για αυτήν τη λειτουργία:



τα πάντα. Πλαίσιο δεδομένων . πτώση ( ετικέτες , άξονας , δείκτης , στήλες , επίπεδο , στη θέση , Σφάλματα )
  1. Πρέπει να περάσουμε μια λίστα δεικτών σειρών στην παράμετρο 'ετικέτες' για να διαγράψουμε όλες τις σειρές από το DataFrame. Μπορούμε επίσης να περάσουμε το χαρακτηριστικό DataFrame.index που επιλέγει όλους τους δείκτες σειρών. Ομοίως, πρέπει να περάσουμε όλα τα ονόματα στηλών σε αυτήν την παράμετρο ή να περάσουμε την ιδιότητα DataFrame.columns.
  2. Ορίστε την παράμετρο 'άξονας' σε 1 εάν μεταβιβάζετε τις στήλες στην παράμετρο 'ετικέτες'. Από προεπιλογή, άξονας = 0 που αναφέρεται στις σειρές.
  3. Μπορούμε να κάνουμε την πράξη (Διαγραφή) στο υπάρχον DataFrame. Ορίστε την παράμετρο 'inplace' σε 'True'.

Παράδειγμα 1:

Σκεφτείτε το DataFrame 'Campaign1' με τέσσερις σειρές και δύο στήλες. Αρχικά, αποθέστε όλες τις σειρές περνώντας τους δείκτες σειρών στην παράμετρο 'ετικέτες' και, στη συνέχεια, αποθέστε όλες τις στήλες περνώντας τις ετικέτες στηλών στην παράμετρο 'ετικέτες'.



εισαγωγή τα πάντα

# Δημιουργία DataFrame - Campaign1 με 2 στήλες και 4 εγγραφές
Καμπάνια 1 = τα πάντα. Πλαίσιο δεδομένων ( [ [ 'στρατόπεδο java' , 'Ινδία' ] , [ 'στρατόπεδο Linux' , 'ΗΠΑ' ] , [ 'c/c++ camp' , 'Ινδία' ] , [ «στρατόπεδο πύθωνα» , 'ΗΠΑ' ] ] ,
στήλες = [ 'Campaign_Name' , 'Τοποθεσία' ] )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Απόθεση όλων των σειρών
Καμπάνια 1. πτώση ( ετικέτες = [ 0 , 1 , 2 , 3 ] , στη θέση = Αληθής )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Απόθεση όλων των στηλών
Καμπάνια 1. πτώση ( ετικέτες = [ 'Campaign_Name' , 'Τοποθεσία' ] , στη θέση = Αληθής , άξονας = 1 )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

Παραγωγή :





Μετά την απόρριψη των γραμμών, οι σειρές αφαιρούνται αλλά οι στήλες υπάρχουν. Μετά την αφαίρεση των στηλών, το 'Campaign1' είναι κενό.



Παράδειγμα 2:

Χρησιμοποιήστε το προηγούμενο DataFrame 'Campaign1' και αποθέστε τις σειρές περνώντας το 'Campaign1.index' στην παράμετρο 'labels' και, στη συνέχεια, αποθέστε τις στήλες περνώντας το 'Campaign.columns' στην παράμετρο 'labels'.

εισαγωγή τα πάντα

# Δημιουργία DataFrame - Campaign1 με 2 στήλες και 4 εγγραφές
Καμπάνια 1 = τα πάντα. Πλαίσιο δεδομένων ( [ [ 'στρατόπεδο java' , 'Ινδία' ] , [ 'στρατόπεδο Linux' , 'ΗΠΑ' ] , [ 'c/c++ camp' , 'Ινδία' ] , [ «στρατόπεδο πύθωνα» , 'ΗΠΑ' ] ] ,
στήλες = [ 'Campaign_Name' , 'Τοποθεσία' ] )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Απόθεση όλων των σειρών
Καμπάνια 1. πτώση ( ετικέτες = Καμπάνια 1. δείκτης , στη θέση = Αληθής )

# Απόθεση όλων των στηλών
Καμπάνια 1. πτώση ( ετικέτες = Καμπάνια 1. στήλες , στη θέση = Αληθής , άξονας = 1 )
Τυπώνω ( Καμπάνια 1 )

Παραγωγή :

Μετά την απόρριψη των γραμμών, οι σειρές αφαιρούνται αλλά οι στήλες υπάρχουν. Μετά την αφαίρεση των στηλών, το 'Campaign1' είναι κενό.

Χρήση του Iloc[]

Η ιδιότητα pandas.DataFrame.iloc[] χρησιμοποιείται για την επιλογή των δεδομένων με βάση τη θέση του ευρετηρίου. Μπορούμε να χρησιμοποιήσουμε αυτήν την ιδιότητα για να επιλέξουμε 0 σειρές και 0 στήλες από το DataFrame. Εδώ, δεν διαγράφουμε το πραγματικό DataFrame, αλλά θα επιλέξουμε 0 εγγραφές.

Σύνταξη :

Πρώτα, πρέπει να διαγράψουμε τις στήλες και μετά τις γραμμές.

  1. Επιλέξτε 0 στήλες – DataFrame.iloc[:,0:0]
  2. Επιλέξτε 0 σειρές – DataFrame.iloc[0:0]

Παράδειγμα :

Χρησιμοποιήστε το ίδιο DataFrame και επιλέξτε το κενό DataFrame χρησιμοποιώντας την ιδιότητα iloc[].

εισαγωγή τα πάντα

# Δημιουργία DataFrame - Campaign1 με 2 στήλες και 4 εγγραφές
Καμπάνια 1 = τα πάντα. Πλαίσιο δεδομένων ( [ [ 'στρατόπεδο java' , 'Ινδία' ] , [ 'στρατόπεδο Linux' , 'ΗΠΑ' ] , [ 'c/c++ camp' , 'Ινδία' ] , [ «στρατόπεδο πύθωνα» , 'ΗΠΑ' ] ] ,
στήλες = [ 'Campaign_Name' , 'Τοποθεσία' ] )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Απόθεση όλων των σειρών
Καμπάνια 1. πτώση ( ετικέτες = [ 0 , 1 , 2 , 3 ] , στη θέση = Αληθής )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Απόθεση όλων των στηλών
Καμπάνια 1. πτώση ( ετικέτες = [ 'Campaign_Name' , 'Τοποθεσία' ] , στη θέση = Αληθής , άξονας = 1 )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

Παραγωγή :

Χρησιμοποιώντας τη λέξη-κλειδί Del

Ολόκληρα τα δεδομένα θα διαγραφούν από το DataFrame χρησιμοποιώντας τη λέξη-κλειδί 'del' επαναλαμβάνοντας όλες τις σειρές μέσα στον βρόχο 'for'.

εισαγωγή τα πάντα

# Δημιουργία DataFrame - Campaign1 με 4 στήλες και 4 εγγραφές
Καμπάνια 1 = τα πάντα. Πλαίσιο δεδομένων ( [ [ 'στρατόπεδο java' , 'Ινδία' ] , [ 'στρατόπεδο Linux' , 'ΗΠΑ' ] , [ 'c/c++ camp' , 'Ινδία' ] , [ «στρατόπεδο πύθωνα» , 'ΗΠΑ' ] ] ,
στήλες = [ 'Campaign_Name' , 'Τοποθεσία' ] )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Χρήση λέξης-κλειδιού del
Για Εγώ σε Καμπάνια 1:
απο Καμπάνια 1 [ Εγώ ]
Τυπώνω ( Καμπάνια 1 )

Παραγωγή :

Τώρα, το DataFrame είναι άδειο.

Χρησιμοποιώντας τη συνάρτηση Pop().

Ολόκληρα τα δεδομένα θα διαγραφούν από το DataFrame χρησιμοποιώντας τη συνάρτηση pop() επαναλαμβάνοντας όλες τις σειρές μέσα στον βρόχο 'for'. Αυτή η συνάρτηση καθορίζεται μέσα στο βρόχο «για».

εισαγωγή τα πάντα

# Δημιουργία DataFrame - Campaign1 με 4 στήλες και 4 εγγραφές
Καμπάνια 1 = τα πάντα. Πλαίσιο δεδομένων ( [ [ 'στρατόπεδο java' , 'Ινδία' ] , [ 'στρατόπεδο Linux' , 'ΗΠΑ' ] , [ 'c/c++ camp' , 'Ινδία' ] , [ «στρατόπεδο πύθωνα» , 'ΗΠΑ' ] ] ,
στήλες = [ 'Campaign_Name' , 'Τοποθεσία' ] )
Τυπώνω ( Καμπάνια 1 , ' \n ' )

# Χρήση pop()
Για Εγώ σε Καμπάνια 1:
Καμπάνια 1. κρότος ( Εγώ )
Τυπώνω ( Καμπάνια 1 )

Παραγωγή :

Τώρα, το DataFrame είναι άδειο.

συμπέρασμα

Μάθαμε πώς να καθαρίζουμε το Pandas DataFrame αφαιρώντας τις γραμμές και τις στήλες. Αρχικά, απορρίψαμε σειρές από το DataFrame χρησιμοποιώντας τη συνάρτηση drop() και μετά αφήσαμε τις στήλες αφού χρησιμοποιήσαμε την ιδιότητα iloc[] για να επιλέξουμε 0 σειρές. Τέλος, συζητήσαμε πώς να διαγράψετε τις εγγραφές από το DataFrame χρησιμοποιώντας τη λέξη-κλειδί 'del' και τη συνάρτηση pop().