Τυπική απόκλιση Pandas

Typike Apoklise Pandas



'Το 'Pandas' είναι μια εξαιρετική γλώσσα για την εκτέλεση της ανάλυσης δεδομένων λόγω του μεγάλου οικοσυστήματος των πακέτων python με επίκεντρο τα δεδομένα. Αυτό διευκολύνει την ανάλυση και την εισαγωγή και των δύο παραγόντων. Η τυπική απόκλιση είναι μια «τυπική» απόκλιση που προέρχεται από τη μέση τιμή. Χρησιμοποιείται πολύ, καθώς επιστρέφει τις αρχικές μονάδες μέτρησης του πλαισίου δεδομένων. Τα πάντα χρησιμοποίησαν την std() για τον υπολογισμό της τυπικής απόκλισης. Η τυπική απόκλιση μπορεί να υπολογιστεί από τις δεδομένες τιμές που μπορούν να βρίσκονται στο πλαίσιο δεδομένων με τη μορφή γραμμής ή στήλης. Θα εφαρμόσουμε όλους τους πιθανούς τρόπους με τους οποίους χρησιμοποιείται η τυπική απόκλιση των πάντα. Για την υλοποίηση του κώδικα, θα χρησιμοποιήσουμε το εργαλείο “spyder” όπως είναι γραμμένο σε περιβάλλον φιλικό προς τους python.”

Σύνταξη







«df.std ( )


Η ακόλουθη σύνταξη χρησιμοποιείται για τον υπολογισμό της τυπικής απόκλισης στο πλαίσιο δεδομένων. Το 'df' στο πλαίσιο δεδομένων είναι η συντομογραφία του 'πλαίσιο δεδομένων'. Τι κάνει η τυπική απόκλιση; Μετρά πόσο εκτεταμένα είναι τα απαιτούμενα δεδομένα. Όσο πιο διευρυμένες οι υψηλές τιμές, τόσο μεγαλύτερη θα πρέπει να εμφανίζεται η τυπική απόκλιση.



ΕΠΙΣΤΡΟΦΗ

Η τυπική απόκλιση pandas επιστρέφει το πλαίσιο δεδομένων εάν το επίπεδο καθορίζεται με βάση την απαίτηση.



Σημειώστε ότι η συνάρτηση 'std()' θα αγνοήσει αυτόματα τις τιμές 'NaN' στο 'df' κατά τον υπολογισμό της τυπικής απόκλισης των panda. Το 'NaN' μπορεί να εξηγηθεί ως 'όχι αριθμός' που σημαίνει ότι δεν έχει εκχωρηθεί τιμή σε ένα συγκεκριμένο.





Ακολουθούν οι μέθοδοι που θα εκτελεστούν με παραδείγματα τυπικής απόκλισης panda:

    • Υπολογισμός τυπικής απόκλισης Panda σε μία στήλη.
    • Υπολογισμός τυπικής απόκλισης Panda σε πολλαπλές στήλες.
    • Υπολογισμός τυπικής απόκλισης Pandas όλων των αριθμητικών στηλών.
    • τυπική απόκλιση panda χρησιμοποιώντας τον άξονα = 1.
    • τυπική απόκλιση panda χρησιμοποιώντας τον άξονα = 0.

Δημιουργία του πλαισίου δεδομένων για τον υπολογισμό της τυπικής απόκλισης στα Panda

Αρχικά, ανοίξτε το λογισμικό 'spyder'. Τώρα εισάγετε τη βιβλιοθήκη pandas ως pd. Θα δημιουργήσουμε ένα πλαίσιο δεδομένων που θα αποτελείται από έναν πίνακα αποτελεσμάτων με όρους 'x', 'y' και 'z' με τα σημεία τους ως '22', '10', '11', '16', '12', '45'. », «36» και «40». Έχουμε τις τιμές των ασίστ τους ως '8', '9', '13', '7', '22', '24', '4' και '6', επίσης, έχοντας την αξία των ριμπάουντ ως '17', ' 14», «3», 5», «9», «8», «7» και «4».




Οι οθόνες δείχνουν το δημιουργημένο πλαίσιο δεδομένων σύμφωνα με τις τιμές που έχουν εκχωρηθεί στον κωδικό:

Παράδειγμα # 01: Υπολογισμός τυπικής απόκλισης Pandas σε μία στήλη

Σε αυτό το παράδειγμα, θα υπολογίσουμε την τυπική απόκλιση μιας στήλης στο πλαίσιο δεδομένων pandas. Το πλαίσιο δεδομένων έχει τις τιμές της ομάδας ως «u», «v» και «b» με τους πόντους τους ως «44», «33», «22», «44», «45», «88», «96 » και «78». Οι τιμές των ασίστ είναι «7»,»8», «9», «10», «11», «14», «18» και «17» έχοντας επίσης τις τιμές των ριμπάουντ ως «11», « 9», «8», «7», «6», «5», «4» και «3». Η στήλη 'σημεία' επιλέγεται από το πλαίσιο δεδομένων για τον υπολογισμό της τυπικής απόκλισης μιας στήλης.


Η έξοδος δείχνει την τυπική απόκλιση που υπολογίζεται για τη στήλη 'σημεία':

Παράδειγμα # 02: Υπολογισμός τυπικής απόκλισης Pandas σε πολλαπλές στήλες

Σε αυτό το παράδειγμα, θα εκτελέσουμε τους υπολογισμούς τυπικής απόκλισης των panda σε πολλαπλές στήλες. Σε αυτό το πλαίσιο δεδομένων, τα δεδομένα είναι και πάλι του πίνακα αποτελεσμάτων των αθλημάτων που έχει τις τιμές της ομάδας ως 'n', 'w' και 't' με τη βαθμολογία '33', '22', '66', '55', '44', '88', '99' και '77'. Οι ασίστ ως “9”, “7”, “8”, “11”, “16”, “14”, “12” και “13” και τα ριμπάουντ ως “5”, “8”, “1”, “ 2», «3», «4», «6» και «7». Εδώ θα υπολογίσουμε την τυπική απόκλιση των δύο στηλών 'points' και 'rebounds' χρησιμοποιώντας τη συνάρτηση std() που εφαρμόζεται στο πλαίσιο δεδομένων.


Όπως βλέπουμε, η έξοδος δείχνει ότι η τυπική απόκλιση ήρθε ως 26,944387 στη στήλη των πόντων και 2,449490 στη στήλη ανάκαμψης, αντίστοιχα.

Παράδειγμα # 03: Υπολογισμός τυπικής απόκλισης Pandas όλων των αριθμητικών στηλών

Τώρα μάθαμε πώς να υπολογίζουμε την τυπική απόκλιση μονής και πολλαπλών σειρών. Τι γίνεται αν δεν θέλουμε να καθορίσουμε όλα τα ονόματα στηλών στο πλαίσιο δεδομένων και να υπολογίσουμε ολόκληρο το πλαίσιο δεδομένων; Αυτό είναι δυνατό με μια απλή εφαρμογή συνάρτησης της τυπικής απόκλισης των panda για τον υπολογισμό του πλήρους πλαισίου δεδομένων συνολικά στα αποτελέσματα. Το πλαίσιο δεδομένων εδώ αποτελείται από 'l', 'm' και 'o' με τις τιμές βαθμολογίας '33', '36', '79', '78', '58', '55' και δύο ομάδες σκοράρουν το ίδιο δηλαδή «25». Οι ασίστ είναι «1», «2», «3», «4», «6», «9», «5» και «7» και τα ριμπάουντ τους ως «14», «10», «2» , “5”, “8”, “3”, “6” και “9”. Μπορούμε να υπολογίσουμε όλες τις τυπικές αποκλίσεις στηλών ανά panda στο πλαίσιο δεδομένων χρησιμοποιώντας τη συνάρτηση pandas “std()”.


Η οθόνη έχει την υπολογισμένη τυπική απόκλιση ολόκληρου του 'df' που φαίνεται παρακάτω. μπορούμε επίσης να παρατηρήσουμε ότι τα πάντα δεν έχουν υπολογίσει την τυπική απόκλιση της πρώτης στήλης, η οποία είναι 'ομάδα', επειδή δεν είναι αριθμητική στήλη.

Παράδειγμα # 04: Τυπική απόκλιση Panda με χρήση του άξονα = 0

Σε αυτό το παράδειγμα, τα πλαίσια δεδομένων έχουν τις ομάδες των αθλημάτων ως 'g', 'h' και 'k' με περαιτέρω δεδομένα. Εδώ, θα υπολογίσουμε την τυπική απόκλιση χρησιμοποιώντας τον άξονα ως «0», μια παράμετρο που χρησιμοποιείται στην τυπική απόκλιση των πάντα. Αυτό το όρισμα υπολογίζει την τυπική απόκλιση κατά στήλη του πλαισίου δεδομένων.


Η ακόλουθη έξοδος εμφανίζει τα αποτελέσματα σε στήλες της τυπικής απόκλισης που υπολογίστηκε. Η στήλη σημείων έχει την υπολογισμένη τυπική απόκλιση ως '24.0313062', η στήλη υποβοήθησης έχει την υπολογισμένη τυπική απόκλιση ως '2.669270' και η υπολογισμένη τυπική απόκλιση της στήλης επαναφοράς εμφανίζεται ως '3.943802'.

Παράδειγμα # 05: Τυπική απόκλιση Panda με χρήση του άξονα = 1

Εδώ θα χρησιμοποιήσουμε την παράμετρο άξονα που έχει εκχωρηθεί ως '1' για να υπολογίσουμε την τυπική απόκλιση στα panda. Τι διαφορά μπορεί να κάνει ο άξονας «1»; Το όρισμα του άξονα '1' υπολογίζει την τυπική απόκλιση κατά σειρά των αριθμητικών τιμών στο πλαίσιο δεδομένων. Το πλαίσιο δεδομένων έχει τις τρεις ομάδες ως 's', 'd' και 'e', με την προσθήκη στηλών δεδομένων που δημιουργούνται ως πόντοι της ομάδας, ασίστ της ομάδας και ριμπάουντ της ομάδας. Όλες οι οδηγίες εκχωρούνται με διαφορετικές τιμές στο πλαίσιο δεδομένων. Αυτή η παράμετρος άξονα είναι μια τέτοια αλλαγή παιχνιδιών, καθώς, μέχρι τη στιγμή, πρέπει να εργαστούμε στα δεδομένα όπου θέλουμε να βρίσκονται σε μια στήλη συν το σημείο που υπολογίζεται για την τυπική απόκλιση που έχει πραγματοποιηθεί.


Η ακόλουθη έξοδος εμφανίζει την τυπική απόκλιση που υπολογίζεται σε μια σειρά του πλαισίου δεδομένων:

συμπέρασμα

Η τυπική απόκλιση Pandas είναι μια πολύ τεχνική λειτουργία, η οποία είναι μια πολύ ευεργετική λειτουργία, καθώς βρίσκει την τυπική απόκλιση του συμφώνου ενθουσιασμού των πλαισίων δεδομένων panda. Σε αυτό το άρθρο, μελετήσαμε τις μεθόδους υπολογισμού της τυπικής απόκλισης στα πάντα. Έχουμε κάνει υπολογισμούς μιας στήλης τυπικής απόκλισης και πολλαπλών στηλών και υπολογίσαμε επίσης την τυπική απόκλιση ολόκληρου του πλαισίου δεδομένων μαζί. Όλες οι στρατηγικές λειτουργούν καλά αρκεί να χρησιμοποιούνται με συνέπεια και με τα επιθυμητά αποτελέσματα.