Pandas DataFrame σε JSON

Pandas Dataframe Se Json



«Τα «πάντα» παρέχουν τη δυνατότητα για χειρισμό δεδομένων καθώς και ανάλυση δεδομένων. Στον σύγχρονο κόσμο, η ανάλυση δεδομένων είναι ένα εξαιρετικά πολύτιμο εργαλείο. Για την ολοκλήρωση αυτής της εργασίας, μια ποικιλία από δομές δεδομένων είναι διαθέσιμες στην επιστήμη των υπολογιστών. Στα 'pandas', έχουμε το DataFrame, το οποίο επίσης μετατρέπεται σε 'JSON'. Μπορούμε να εξηγήσουμε το 'JSON' καθώς είναι ένα κείμενο που χρησιμοποιεί σημειώσεις αντικειμένου JavaScript. Η μεταφορά δεδομένων μεταξύ διακομιστών και εφαρμογών ιστού χρησιμοποιεί το 'JSON'. Σε αυτόν τον οδηγό, θα εξετάσουμε τη μετατροπή μορφής JSON των DataFrames. Για αυτήν τη μετατροπή από το DataFrame στο 'Json', το 'pandas' παρέχει τη μέθοδο 'to_json()'. Όποτε χρειάζεται να μετατρέψουμε το DataFrame σε μορφή 'JSON', χρησιμοποιούμε τη μέθοδο 'to_json()' των 'pandas'. Για να κατανοήσουμε καλύτερα πώς να χρησιμοποιήσετε τη λειτουργία των 'pandas' που είναι 'to_json', ας δούμε μερικούς κωδικούς των 'pandas' εδώ σε αυτόν τον οδηγό.'

Παράδειγμα #01
Θα δείξουμε στην πράξη πώς να χρησιμοποιήσετε τη μέθοδο 'to_json()' των 'pandas' για την αλλαγή του DataFrame 'pandas' σε μορφή JSON. Το πακέτο 'pandas' εισάγεται εδώ, που είναι το 'numpy', και το εισάγουμε ως 'np'. Τώρα, για να εκτελέσετε τον κώδικα 'pandas', θα πρέπει να εισαχθούν τα πακέτα του panda. Για να εισαγάγουμε αυτό το πακέτο, χρησιμοποιούμε τη λέξη-κλειδί «εισαγωγή». Στη συνέχεια, ορίζουμε το 'pandas ως pd', που σημαίνει ότι μπορούμε εύκολα να έχουμε πρόσβαση ή να χρησιμοποιήσουμε οποιοδήποτε 'pandas πακέτο' που χρειαζόμαστε τοποθετώντας απλώς το 'pd' εκεί.

Δημιουργούμε τον πίνακα numpy εδώ χρησιμοποιώντας το 'np. array', αυτό το 'np' μας βοηθά να έχουμε πρόσβαση στις numpy συναρτήσεις της βιβλιοθήκης. Αυτός ο numpy πίνακας αποθηκεύεται επίσης στη μεταβλητή 'New_data' και βάζουμε 'A, B, C, D' και 'E, F, G, H' σε αυτόν τον numpy πίνακα. Αυτός ο numpy πίνακας μετατρέπεται τώρα στο DataFrame χρησιμοποιώντας τη μέθοδο 'pd.DataFrame'. Αυτή είναι η μέθοδος 'pandas' στην οποία έχουμε πρόσβαση εδώ τοποθετώντας το 'pd'. Όταν μετατρέπουμε αυτόν τον numpy πίνακα στο DataFrame, τότε βάζουμε και τα ονόματα των στηλών.







Τα ονόματα που προσθέτουμε εδώ ως κεφαλίδες στηλών είναι 'col1, col2, col3 και col4'. Στη συνέχεια, βλέπετε ότι έχουμε την 'εκτύπωση' παρακάτω στην οποία ορίζουμε το όνομα του DataFrame, το οποίο σε αυτήν την περίπτωση είναι 'New_dataFrame', οπότε αυτό θα αποδοθεί κατά την εκτέλεση αυτού του κώδικα. Τώρα, μετατρέπουμε αυτό το DataFrame σε μορφή JSON χρησιμοποιώντας τη μέθοδο 'to_json()'. Ορίζουμε το όνομα του DataFrame 'New_dataFrame' με τη μέθοδο 'to_json()' και τοποθετούμε επίσης αυτήν τη μέθοδο στη μεταβλητή 'New_json'. Εδώ, δεν περάσαμε καμία παράμετρο σε αυτήν τη μέθοδο 'to_json()'. Η μορφή JSON του DataFrame έχει πλέον τοποθετηθεί σε 'εκτύπωση' και θα αποδοθεί επίσης στην κονσόλα.





Για τη μεταγλώττιση και την εκτέλεση αυτού του κώδικα, πατάμε 'Shift+Enter' και εάν ο κώδικας είναι χωρίς σφάλματα, τότε η έξοδος θα αποδοθεί. Εδώ επικολλάμε επίσης το αποτέλεσμα αυτού του κώδικα στον οποίο δείξαμε το DataFrame που δημιουργήσαμε σε αυτό το παράδειγμα και επίσης τη μορφή JSON αυτού του DataFrame.





Παράδειγμα #02
Εδώ, εισάγουμε μόνο μία βιβλιοθήκη, η οποία είναι τα 'pandas' και στη συνέχεια δημιουργείται η λίστα 'AtoZ_Courses' και τοποθετούμε μερικές λίστες σε αυτήν, οι οποίες είναι 'Python, 29000, 35 ημέρες και 1000.0', μετά βάζουμε ' JavaScript, 27000, 55 ημέρες και 2300.0', μετά από αυτό, προσθέτουμε 'HTMLCSS, 25000, 25 ημέρες και 1500.0'. Τώρα, εισαγάγαμε επίσης δύο ακόμη δεδομένα ως 'Βάση δεδομένων, 24000, 45 ημέρες και 1500.0' και 'OOP, 21000, 35 ημέρες, 1500.0'. Η λίστα 'AtoZ_Courses' έχει πλέον αλλάξει στο DataFrame και την ονομάσαμε 'AtoZ_Courses_df'. Τα 'Courses_Name, Payment, Duration, and Bonus' προστίθενται εδώ ως ονόματα στηλών του DataFrame.



Τώρα, το DataFrame δημιουργείται σε αυτό το βήμα και το προσθέτουμε στη δήλωση 'print()' για να το εμφανίσουμε στο τερματικό. Τώρα, χρησιμοποιώντας τη μέθοδο 'to_json()', μετατρέπουμε το DataFrame 'AtoZ_Courses_df' σε μορφή JSON. Σε αυτήν τη μέθοδο 'to_json()' δίνεται επίσης μια παράμετρος που είναι 'orient= στήλη', η οποία είναι επίσης η προεπιλεγμένη παράμετρος. Εμφανίζει το DataFrame ως dict ως '{column name -> {index value -> column value}} format'.

Εδώ, σε μορφή JSON, εμφανίζει το όνομα της στήλης και, στη συνέχεια, βάζει όλες τις τιμές αυτής της στήλης μαζί με την τιμή του ευρετηρίου. Αρχικά, αναφέρει το όνομα της πρώτης στήλης και, στη συνέχεια, αποδίδονται όλες οι τιμές της πρώτης στήλης μαζί με τις τιμές του ευρετηρίου και, στη συνέχεια, βάζει το όνομα της δεύτερης στήλης και επίσης όλες τις τιμές της δεύτερης στήλης με ευρετήρια και ούτω καθεξής.

Παράδειγμα #03
Το DataFrame δημιουργείται σε αυτόν τον κώδικα με το όνομα 'Bachelors_df'. Έχουμε εισαγάγει πέντε στήλες σε αυτό το 'Bachelors_df'. Η πρώτη στήλη που έχουμε εδώ είναι η στήλη 'Μαθητής' και εισάγουμε 'Lily, Smith, Bromley, Milli και Alexander' σε αυτήν. Η στήλη που ακολουθεί είναι η στήλη 'Πτυχίο', η οποία περιέχει 'IT, BBA, Αγγλικά, CS και DVM'. Έπειτα έρχεται το «year_of_joining» όπου προσθέτουμε τα έτη συμμετοχής των μαθητών, τα οποία είναι «2015, 2018, 2017, 2015, και 2014».

Η στήλη δίπλα σε αυτήν τη στήλη είναι 'year_of_graduation', η οποία περιέχει τα έτη αποφοίτησης αυτών των μαθητών είναι '2019, 2022, 2021, 2019 και 2018'. Προσθέτουμε επίσης τη στήλη «CGPA» εδώ στην οποία τοποθετούμε τα CGPA των μαθητών «3.3, 3.5, 3.6, 3.7, και 3.8». Για να εμφανίσουμε το 'Bachelors_df' στο τερματικό, το συμπεριλαμβάνουμε στην έκφραση 'print()'. Τώρα, μετατρέπουμε το DataFrame 'Bachelors_df' σε μορφή JSON χρησιμοποιώντας τη μέθοδο 'to_json()'.

Η παράμετρος 'orient= records' μεταβιβάζεται επίσης σε αυτήν τη μέθοδο 'to_json()' σε αυτόν τον κώδικα. Αυτή η 'orient= εγγραφές' θα εμφανίσει τη μορφή JSON ως μορφή '[{όνομα στήλης -> τιμή στήλης}, … , {όνομα στήλης -> τιμή στήλης}]'. Η μορφή JSON του DataFrame έχει πλέον ρυθμιστεί σε 'εκτύπωση' και θα εμφανίζεται επίσης στο τερματικό.

Το DataFrame εμφανίζεται απλώς εδώ σε μορφή στηλών και σειρών, αλλά σε μορφή JSON, μπορείτε να παρατηρήσετε ότι βάζει το όνομα της στήλης και στη συνέχεια εμφανίζει την τιμή αυτής της στήλης. Αφού εμφανίσει την τιμή μιας στήλης, εκτυπώνει το όνομα της δεύτερης στήλης και στη συνέχεια βάζει την τιμή αυτής της στήλης και μετά ούτω καθεξής επειδή ορίσαμε την παράμετρο της μεθόδου 'to_josn' ως 'orient= records'.

Παράδειγμα #04
Δημιουργούμε έναν numpy πίνακα 'My_data' στον οποίο εισάγουμε τα '2, 4' και '6, 8'. Στη συνέχεια, αλλάξτε τον πίνακα numpy στο DataFrame 'My_dataFrame' και ορίστε τα ονόματα στηλών του ως 'A1 και A2'. Τώρα, μετά την εμφάνιση του DataFrame εδώ χρησιμοποιώντας το 'print'. Χρησιμοποιούμε πρώτα τη μέθοδο “to_json()” χωρίς καμία παράμετρο και την εμφανίζουμε. Μετά από αυτό, ορίζουμε την παράμετρο των μεθόδων 'to_json()' σε 'orient=split' και εκτυπώνουμε επίσης αυτή τη μορφή. Στη συνέχεια εφαρμόζουμε ξανά το “to_josn()” στο “My_dataFrame” και αυτή τη φορά, περνάμε το “orient=records” ως παράμετρο αυτής της συνάρτησης.

Κάτω από αυτό, βάζουμε το 'orient= index' με το 'My_dataFrame' και αποδίδουμε αυτήν τη μορφή JSON. Μετά από αυτήν την παράμετρο, χρησιμοποιούμε ξανά την παράμετρο 'to_json' με την παράμετρο 'orient = στήλη' και την αποδίδουμε επίσης. Στη συνέχεια περνάμε το “orient= values” ως παράμετρο της μεθόδου “to_json()” και το εφαρμόζουμε στο “My_dataFrame”. Επίσης, ορίσαμε την παράμετρο αυτής της συνάρτησης σε “orient= table” και την χρησιμοποιούμε ξανά με το ίδιο DataFrame και εμφανίζουμε επίσης αυτή τη μορφή JSON. Τώρα, θα σημειώσουμε τη διαφορά μεταξύ των μορφών του JSON στην έξοδο αυτού του κώδικα.

Εδώ, μπορείτε εύκολα να βρείτε τη διαφορά μεταξύ των μορφών του JSON, που έχουμε εφαρμόσει στο ίδιο DataFrame. Όλες οι παράμετροι που έχουμε μεταβιβάσει στη μέθοδο 'to_json' εμφανίζονται σε διαφορετικές μορφές εδώ.

συμπέρασμα

Αυτός ο οδηγός δείχνει τη μορφή JSON και έχει εξηγήσει λεπτομερώς αυτήν τη μορφή JSON και πώς να μετατρέψετε το Pandas DataFrame σε JSON. Έχουμε εξηγήσει ότι η μέθοδος 'to_json()' χρησιμοποιείται για τη μετατροπή του DataFrame των pandas σε μορφή JSON. Έχουμε επίσης συζητήσει διάφορες παραμέτρους, τις οποίες έχουμε περάσει στη μέθοδο 'to_json()' εδώ. Παρέχουμε έναν πλήρη οδηγό στον οποίο έχουμε χρησιμοποιήσει τις μεθόδους 'to_json()' βάζοντας όλες τις πιθανές παραμέτρους σε αυτήν τη μέθοδο 'to_json()' στον κώδικα 'pandas' μας και επίσης τις δείξαμε στην έξοδο πώς αυτές οι παράμετροι αλλάζουν τη μορφή του JSON.