Pandas στο λεξικό

Pandas Sto Lexiko



«Στην Python, μια δομή δεδομένων που ονομάζεται λεξικό χρησιμοποιείται για την αποθήκευση πληροφοριών ως ζεύγη κλειδιού-τιμής. Τα αντικείμενα λεξικού βελτιστοποιούνται για εξαγωγή δεδομένων/τιμών όταν το κλειδί ή τα κλειδιά είναι γνωστά. Λάβετε υπόψη ότι τα λεξικά μπορεί να περιλαμβάνουν διπλότυπα κλειδιά. Για να βρούμε αποτελεσματικά τιμές χρησιμοποιώντας το σχετικό ευρετήριο, μπορούμε να μετατρέψουμε μια σειρά pandas ή ένα πλαίσιο δεδομένων με σχετικό ευρετήριο σε αντικείμενο λεξικού με ζεύγη κλειδιού-τιμής «index: value». Για να επιτευχθεί αυτό το έργο, μπορεί να χρησιμοποιηθεί η μέθοδος 'to_dict()'. Αυτή η συνάρτηση είναι μια ενσωματωμένη συνάρτηση που βρίσκεται στην κατηγορία Series της μονάδας pandas. Ένα πλαίσιο δεδομένων μετατρέπεται σε ένα λεξικό δεδομένων σειρών που μοιάζει με λίστα python χρησιμοποιώντας τη μέθοδο pandas.to_dict(), ανάλογα με την καθορισμένη τιμή της παραμέτρου orient.'

Πώς να μετατρέψετε τα πάντα σε λεξικό Python;

Υπάρχουν πολλές μέθοδοι για να μετατρέψετε τα πάντα σε λεξικό. Ωστόσο, για να μετατρέψουμε ένα πλαίσιο δεδομένων Pandas σε λεξικό Python, θα χρησιμοποιήσουμε τη μέθοδο to_dict() στα Pandas. Μπορούμε να προσανατολίσουμε τα ζεύγη κλειδιών-τιμών του επιστρεφόμενου λεξικού με διάφορους τρόπους χρησιμοποιώντας τη συνάρτηση to_dict(). Η σύνταξη της συνάρτησης είναι η εξής:







Σύνταξη



pandas.to_dict ( ανατολή = «υπαγόρευση», σε = )



Παράμετροι

Ανατολή: Ποιος τύπος δεδομένων για μετατροπή στηλών (σειρά σε) καθορίζεται από την τιμή συμβολοσειράς ('dict', 'list', 'records', 'index', 'series', 'split'). Για παράδειγμα, η λέξη-κλειδί «λίστα» θα έδινε ένα λεξικό python αντικειμένων λίστας με τα κλειδιά «Όνομα στήλης» και «Λίστα» (σειρές μετατροπής) ως έξοδο.





σε: κλάση, μπορεί να περάσει ως παρουσία ή πραγματική κλάση. Για παράδειγμα, μια παρουσία κλάσης μπορεί να περάσει στην περίπτωση μιας προεπιλεγμένης εντολής. Η προεπιλεγμένη τιμή της παραμέτρου είναι dict.

Τύπος επιστροφής: Λεξικό που έχει μετατραπεί από πλαίσιο δεδομένων ή σειρά.



Παράδειγμα # 01: Μετατροπή του πλαισίου δεδομένων Pandas σε λεξικό

Χρησιμοποιώντας την πλειάδα των λιστών στη συνάρτηση pd.DataFrame(), θα δημιουργήσουμε ένα βασικό πλαίσιο δεδομένων με μερικές στήλες και σειρές, ώστε αργότερα να το μετατρέψουμε σε λεξικό python.


Δημιουργήσαμε το πλαίσιο δεδομένων μας περνώντας τη λίστα μέσα στη συνάρτηση pd.DataFrame(). Στο παραπάνω πλαίσιο δεδομένων, έχουμε τρεις στήλες «εταιρεία», «πωλήσεις» και «έσοδα». Στη στήλη εταιρεία, έχουμε αποθηκεύσει τα ονόματα των τυχαίων εταιρειών ως ('A&B', 'Max_tech', 'XT', 'MJ', 'Quanto', 'Mini_X', 'Zomo', 'AU', 'HL' , 'ZMX', 'Earny'), η στήλη 'πωλήσεις' αντιπροσωπεύει τις πωλήσεις κάθε εταιρείας ως ('217', '200', '199', '150', '210', '216', '185 ', '189', '202', '159', '205') και στη στήλη 'έσοδα' αποθηκεύονται οι τιμές που αντιπροσωπεύουν τα έσοδα κάθε εταιρείας έναντι των αντίστοιχων πωλήσεων (340000   320000  300000 270000  315000  315000  315000  315000  315000  315000  315 000 4 5 0 0 305000). Τώρα θα μετατρέψουμε το πλαίσιο δεδομένων μας 'df' σε λεξικό python.


Εφαρμόζοντας τη μέθοδο to_dict() στο πλαίσιο δεδομένων df, έχουμε μετατρέψει ένα πλαίσιο δεδομένων pandas σε λεξικό.

Παράδειγμα # 02: Μετατροπή του πλαισίου δεδομένων Pandas που δημιουργήθηκε από ένα αρχείο CSV σε λεξικό

Στο παράδειγμα # 1, δημιουργήσαμε ένα πλαίσιο δεδομένων χρησιμοποιώντας πλειάδες μέσα στη λίστα. Τώρα θα δημιουργήσουμε ένα πλαίσιο δεδομένων με τη βοήθεια ενός αρχείου CSV και στη συνέχεια θα το μετατρέψουμε σε λεξικό χρησιμοποιώντας τη συνάρτηση to_dict().


Για να διαβάσουμε ένα αρχείο ως πλαίσιο δεδομένων, χρησιμοποιήσαμε τη συνάρτηση pd.read_csv(). Στο παραπάνω πλαίσιο δεδομένων, έχουμε δύο στήλες (Όνομα και σημάδια) και δεκαεπτά σειρές (από το 0 έως το 16). Τώρα θα χρησιμοποιήσουμε τη μέθοδο to_dict().


Η συνάρτηση έχει μετατρέψει το πλαίσιο δεδομένων μας 'df' σε λεξικό python.

Παράδειγμα # 03: Μετατρέψτε το πλαίσιο δεδομένων Pandas στο λεξικό που περιέχει τις λίστες τιμών

Στα προηγούμενα παραδείγματα, έχουμε μετατρέψει τα πάντα σε ένα λεξικό python που περιέχει πολλά λεξικά. Κατά τη μετατροπή ενός πλαισίου δεδομένων σε αντικείμενο λεξικού, οι ετικέτες στηλών θα πρέπει να χρησιμεύουν ως κλειδιά του λεξικού και όλα τα δεδομένα ή οι τιμές των στηλών θα πρέπει να προστίθενται στο λεξικό που προκύπτει ως λίστα τιμών για κάθε κλειδί.


Δημιουργήσαμε το πλαίσιο δεδομένων με τρεις στήλες «όνομα», «χώρα» και «ηλικία». Στη στήλη 'όνομα', έχουμε αποθηκεύσει τις τιμές δεδομένων ('Anna', 'Marty', 'Carl', 'Mary', 'Cleb', 'Ali', 'Alexa', 'Becky', 'Ryan') . Ενώ οι άλλες στήλες χώρα και ηλικία είναι ισχυρές τιμές όπως ('ΗΠΑ', 'Αγγλία', 'ΗΠΑ', 'Γαλλία', 'Ρωσία', 'Ρωσία', 'Γαλλία', 'Αγγλία', 'ΗΠΑ') και ( 34, 32, 30, 27, 31, 33, 35, 25, 30) αντίστοιχα. Θα δημιουργήσουμε ένα λεξικό που θα περιέχει τις λίστες χρησιμοποιώντας την παράμετρο 'list' μέσα στη μέθοδο to_dict().


Χρησιμοποιώντας την παράμετρο λίστα ως όρισμα μέσα στη συνάρτηση to_list(), δημιουργήσαμε ένα λεξικό που περιέχει πολλές λίστες.

Παράδειγμα # 03: Μετατρέψτε το πλαίσιο δεδομένων Pandas στο λεξικό που περιέχει τη σειρά τιμών

Όταν ένα DataFrame πρέπει να μετατραπεί σε λεξικό, το όνομα της στήλης χρησιμεύει ως πλήκτρα λεξικού και το ευρετήριο γραμμής και τα δεδομένα στη στήλη ως τιμή για τα αντίστοιχα κλειδιά στο λεξικό.


Δημιουργήσαμε το απαιτούμενο πλαίσιο δεδομένων χρησιμοποιώντας τη μέθοδο pd.DataFrame(). Στο πλαίσιο δεδομένων που δημιουργήθηκε πρόσφατα, έχουμε δύο στήλες. Η στήλη ονόματος αποθηκεύει τις τιμές δεδομένων ως συμβολοσειρά ('Kim', 'Morris', 'Casper', 'Milli', 'Dave', 'Will', 'Billy'), ενώ οι στήλες σημάτων αποτελούνται από αριθμητικά δεδομένα ως ( 8, 9, 6, 7, 10, 7, 8). Θα χρησιμοποιήσουμε την παράμετρο “series” ως συμβολοσειρά μέσα στη συνάρτηση to_dict().

Παράδειγμα # 04: Μετατρέψτε το πλαίσιο δεδομένων Pandas στο λεξικό χωρίς ευρετήριο και κεφαλίδα

Η παράμετρος 'split' της συνάρτησης to_dict() μπορεί να χρησιμοποιηθεί για την εξαγωγή δεδομένων από ένα DataFrame χωρίς τις κεφαλίδες των στηλών ή όταν πρέπει να αφαιρέσουμε την κεφαλίδα και το ευρετήριο της γραμμής από τα δεδομένα. Οι ετικέτες στηλών, το ευρετήριο σειρών και τα πραγματικά δεδομένα χωρίζονται σε τρία στοιχεία χρησιμοποιώντας αυτήν την παράμετρο. Ας δημιουργήσουμε ένα πλαίσιο δεδομένων, ώστε να μπορούμε να το χωρίσουμε σε τρία μέρη ενώ το μετατρέπουμε στο λεξικό.


Δημιουργήσαμε δύο στήλες με ετικέτες 'όνομα' και 'ηλικία' που περιέχουν τιμές ('Dave', 'Morris', 'Billy', 'Milli', 'Kim', 'Will', 'Casper') και (19, 19 , 25, 21, 19, 21, 23) αντίστοιχα. Ας τα μετατρέψουμε σε λεξικά python.


Χρησιμοποιώντας το κλειδί 'δεδομένα', μπορούμε να ανακτήσουμε τα δεδομένα από το λεξικό που προκύπτει χωρίς ευρετήριο ή κεφαλίδα.

Παράδειγμα # 05: Μετατροπή πλαισίου δεδομένων Pandas στο λεξικό κατά σειρά και ευρετήριο σειράς

Η παράμετρος 'record' μπορεί να χρησιμοποιηθεί μέσα στη συνάρτηση to_dict() για την αποθήκευση δεδομένων κάθε σειράς πλαισίου δεδομένων σε πολλαπλά διακριτά αντικείμενα λεξικού μέσα σε μια λίστα ή όταν απαιτούνται δεδομένα κατά σειρά. Θα επιστραφεί μια λίστα που περιέχει αντικείμενα λεξικού. Ένα λεξικό με ετικέτα στήλης ως κλειδί και δεδομένα στήλης ως τιμή για κάθε σειρά.


Δημιουργήσαμε ένα πλαίσιο δεδομένων με στήλες 'όνομα' και 'μισθός'. Η στήλη 'όνομα' περιέχει τις τιμές δεδομένων ('Leo', 'Haris', 'Wanda', 'Mike', 'Kelly', 'Adam', 'Jack') και η στήλη μισθού αποθηκεύει τις τιμές (12000, 12500 , 14000, 11000, 12000, 13000, 12500). Τώρα ας δημιουργήσουμε μια λίστα με πολλά λεξικά python που περιέχουν δεδομένα κάθε σειράς.


Η παράμετρος ευρετηρίου μπορεί επίσης να χρησιμοποιηθεί για τη μετατροπή των δεδομένων κάθε σειράς από ένα πλαίσιο δεδομένων σε ένα λεξικό. Θα επιστραφεί μια λίστα που περιέχει στοιχεία λεξικού. Κάθε σειρά δημιουργεί ένα λεξικό. Όπου το ευρετήριο γραμμής θα είναι το κλειδί και η τιμή θα είναι το λεξικό δεδομένων και η ετικέτα στήλης.

συμπέρασμα

Σε αυτό το σεμινάριο, έχουμε συζητήσει πώς μπορούμε να μετατρέψουμε το πλαίσιο δεδομένων ή τα αντικείμενα panda σε ένα λεξικό python. Είδαμε τη σύνταξη της συνάρτησης to_dict() για να κατανοήσουμε τις παραμέτρους αυτής της συνάρτησης και πώς μπορείτε να τροποποιήσετε την έξοδο της συνάρτησης καθορίζοντας τη συνάρτηση με διαφορετικές παραμέτρους. Στα παραδείγματα αυτού του σεμιναρίου, χρησιμοποιήσαμε τη μέθοδο to_dict(), μια ενσωματωμένη συνάρτηση panda, για να αλλάξουμε τα αντικείμενα panda στο λεξικό python.