Σειρά Pandas σε CSV

Seira Pandas Se Csv



Η μέθοδος 'Series.to_csv()' στα Pandas εξάγει το καθορισμένο αντικείμενο σειράς σε συμβολισμό τιμών διαχωρισμένων με κόμματα (csv). Αυτή η συνάρτηση παίρνει απλώς τις τιμές από μια σειρά και τροποποιεί τη μορφή τους προσθέτοντας κόμματα για τον διαχωρισμό τιμών ευρετηρίου και στήλης.

Για να χρησιμοποιήσουμε αυτή τη συνάρτηση, πρέπει να χρησιμοποιήσουμε την ακόλουθη σύνταξη:









Αυτό το άρθρο θα σας παρέχει δύο διαφορετικές τεχνικές για να μάθετε τους τρόπους χρήσης αυτής της μεθόδου σε ένα πρόγραμμα python.



Παράδειγμα # 1: Χρήση της μεθόδου Series.to_csv() για τη μετατροπή μιας σειράς με DatetimeIndex σε τιμές διαχωρισμένες με κόμμα

Για να τροποποιήσουμε μια σειρά σε μορφή CSV, θα χρησιμοποιήσουμε τη συνάρτηση 'Series.to_csv()'. Αυτή η εικόνα θα δημιουργήσει μια σειρά με ένα δείκτη ημερομηνίας και στη συνέχεια θα τη μετατρέψει σε μια μορφή τιμών διαχωρισμένων με κόμματα.





Για να θέσουμε σε λειτουργία αυτή τη μέθοδο, πρέπει να έχουμε εργαλείο που να υποστηρίζει προγραμματισμό python. Το εργαλείο 'Spyder' επιλέγεται για τη μεταγλώττιση των κωδικών. Για να γράψουμε το σενάριο σε αυτό, ξεκινήσαμε πρώτα το εγκατεστημένο εργαλείο στο σύστημά μας. Το πρόγραμμα python χρειάζεται μια βιβλιοθήκη για να ασκήσει τις μεθόδους του για την επίτευξη του απαιτούμενου αποτελέσματος. Η βιβλιοθήκη που έχουμε φορτώσει εδώ είναι τα “Pandas”. Στην ίδια γραμμή κώδικα, το ψευδώνυμο αυτής της βιβλιοθήκης προσδιορίζεται ως 'pd'. Οπότε, σε οποιοδήποτε μέρος του προγράμματος, πρέπει να γράψουμε 'pandas' για να αποκτήσουμε πρόσβαση σε μια συνάρτηση. Αντ' αυτού θα γράφαμε 'pd'.

Το πρώτο βήμα για να ξεκινήσετε με τον κώδικα είναι να δημιουργήσετε μια σειρά Pandas. Πρέπει να γράψουμε 'pd' για να χρησιμοποιήσουμε τη μέθοδο δημιουργίας σειράς από pandas. Η συνάρτηση 'pd.Series()' καλείται για την κατασκευή μιας σειράς με τις καθορισμένες τιμές. Οι τιμές που έχουμε παράσχει για τη σειρά είναι «Istanbul», «Izmir», «Ankara», «Ankara», «Antalya», «Konya» και «Bursa». Εάν θέλετε να δώσετε ένα όνομα σε αυτόν τον πίνακα τιμών, μπορείτε να το κάνετε χρησιμοποιώντας την παράμετρο 'όνομα'. Εδώ, ονομάσαμε αυτόν τον πίνακα τιμών 'Πόλεις', καθώς περιέχει τα ονόματα 6 πόλεων. Για την αποθήκευση αυτής της σειράς, έχει δημιουργηθεί ένα αντικείμενο σειράς 'Turkey'.



Για να δημιουργήσουμε ένα DatetimeIndex, χρησιμοποιήσαμε τη μέθοδο 'pd.date_range()'. Ανάμεσα στις παρενθέσεις αυτής της συνάρτησης, έχουμε περάσει 4 ορίσματα τα οποία είναι: 'start', 'freq', 'periods' και 'tz'.

Το όρισμα 'έναρξη' χρειάζεται μια ημερομηνία και ώρα για να αρχίσει να δημιουργεί ένα εύρος ημερομηνιών από αυτό. Εδώ, έχουμε ορίσει την ημερομηνία και ώρα έναρξης ως '2022-03-02 02:30'. Η παράμετρος 'freq' ταξινομεί τη συχνότητα για το εύρος ημερομηνιών. Έτσι, του δώσαμε την τιμή 'D'. Τώρα, θα δημιουργήσει ένα εύρος ημερομηνιών σε ημερήσια συχνότητα. Το όρισμα 'περίοδος' έχει οριστεί σε '6', που σημαίνει ότι θα δημιουργήσει ένα εύρος ημερομηνιών για 6 ημέρες. Η τελευταία παράμετρος είναι 'tz' που καθορίζει τη ζώνη ώρας για την καθορισμένη περιοχή. Έχουμε καθορίσει τη ζώνη ώρας για 'Ασία/Κωνσταντινούπολη'.

Για να αποθηκεύσουμε αυτό το εύρος ημερομηνιών, έχουμε δημιουργήσει μια μεταβλητή 'Ημερομηνία' μεταβλητή. Για να ορίσουμε το DatetimeIndex, χρησιμοποιήσαμε την ιδιότητα 'Series.index'. Το όνομα της σειράς 'Turkey' παρέχεται με την ιδιότητα '.index' και του εκχωρείται το χρονικό εύρος ημερομηνιών που είναι αποθηκευμένο στη μεταβλητή 'Datetime'. Έτσι, η ιδιότητα 'index' θα λάβει τις τιμές από τη μεταβλητή 'Datetime' και θα τις κάνει τη λίστα ευρετηρίου της σειράς 'Turkey'. Τέλος, για να προβάλουμε τη σειρά εξόδου, χρησιμοποιήσαμε τη μέθοδο 'print()' και περάσαμε τη σειρά 'Turkey' ως είσοδο για να εμφανίσουμε το περιεχόμενό της.

Απλώς πατήσαμε την επιλογή 'Εκτέλεση αρχείου' για να εκτελέσουμε το σενάριο. Συνεπώς, μπορούμε να δούμε μια σειρά με το DatetimeIndex που ξεκινά από το '2022-03-02 02:30:00+03:00' και τελειώνει στο '2022-03-07 02:30:00+03:00' δημιουργώντας μια περίοδο των 6 ημερών. Κάτω από τη σειρά αναφέρονται επίσης το “Freq :D”, το όνομα της λίστας του πίνακα “Cities” και ο τύπος d “object”.

Τώρα, θα μάθουμε να μετατρέπουμε αυτή τη σειρά που μόλις είδαμε στο παραπάνω στιγμιότυπο σε μορφή CSV. Για να τροποποιήσουμε τη σειρά σε τιμές διαχωρισμένες με κόμμα, έχουμε μια μέθοδο που παρέχεται από την ενότητα pandas η οποία είναι 'Series.to_csv()'. Αυτή η μέθοδος παίρνει τις τιμές της παρεχόμενης σειράς και προσθέτει κόμματα μεταξύ των τιμών της στήλης.

Καλείται η συνάρτηση 'Series.to_csv()'. Το όνομα της σειράς που θέλουμε να μετατρέψουμε αναφέρεται με τη μέθοδο ως “Turkey.to_csv()”. Για να διατηρήσουμε τις τιμές διαχωρισμένες με κόμμα, δημιουργήσαμε μια μεταβλητή 'Comma_Separated' και στη συνέχεια τοποθετήσαμε το περιεχόμενό της στο παράθυρο εξόδου επικαλώντας τη συνάρτηση 'print()'.

Εδώ είναι η σειρά μας σε μορφή csv. Μπορούμε να δούμε στο στιγμιότυπο ότι οι τιμές του δείκτη και της σειράς έχουν διαχωριστεί χρησιμοποιώντας τα κόμματα σε αυτά.

Παράδειγμα # 2: Χρήση της μεθόδου Series.to_csv() για τη μετατροπή μιας σειράς με τιμές NaN σε τιμές διαχωρισμένες με κόμμα

Η δεύτερη τεχνική για την άσκηση της μεθόδου 'Series.to_csv()' είναι η εφαρμογή αυτής της μεθόδου για τη μετατροπή μιας σειράς που περιέχει ορισμένες μηδενικές εγγραφές σε μορφή CSV.

Έχουμε εισάγει αρχικά τα απαραίτητα πακέτα. Το 'pd' γίνεται ψευδώνυμο για τα πάντα και το 'np' ως ψευδώνυμο για το numpy. Η εργαλειοθήκη numpy φορτώνεται εδώ επειδή θα κάνουμε μερικές μηδενικές εγγραφές στη σειρά μας χρησιμοποιώντας το 'np.NaN' ενώ θα το δημιουργούμε χρησιμοποιώντας τη μέθοδο pandas 'pd.Series()'.

Η συνάρτηση 'pd.Series()' καλείται για τη δημιουργία μιας σειράς panda με αυτές τις τιμές: 'Nile', 'Amazon', np.NaN, 'Ganges', 'Mississippi', 'np.NaN', 'Yangtze', «Δούναβης», «Μεκόνγκ», «np.NaN» και «Βόλγα». Υπάρχουν συνολικά 21 τιμές που ορίζονται για τη σειρά από τις οποίες 3 καταχωρήσεις έχουν τιμές 'np.NaN', που σημαίνει ότι λείπουν 3 τιμές από τη σειρά. Η ιδιότητα 'όνομα' καθορίζει το όνομα για αυτόν τον πίνακα τιμών που δώσαμε 'Τίτλοι'. Η ιδιότητα 'ευρετήριο' χρησιμοποιείται για να ορίσετε τη λίστα ευρετηρίων που ορίζεται από το χρήστη αντί να ακολουθεί την προεπιλεγμένη λίστα.

Εδώ, θέλουμε τη λίστα ευρετηρίου με τις τιμές '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', και 21». Τώρα, η σειρά μας θα έχει τη λίστα ευρετηρίων που ξεκινά από το '10' αντί για το '0'. Τώρα, αποθηκεύστε αυτήν τη σειρά για να μπορούμε να τη χρησιμοποιήσουμε αργότερα στο πρόγραμμα. Αρχικοποιήσαμε ένα αντικείμενο σειράς 'Rivers' και του εκχωρήσαμε τη σειρά εξόδου που δημιουργήθηκε από την κλήση της μεθόδου 'pd.Series()'. Η σειρά μπορεί να εμφανιστεί τοποθετώντας την στην οθόνη χρησιμοποιώντας τη συνάρτηση «print()» από την python.

Το αποτέλεσμα απόδοσης στο τερματικό εκτύπωσε μια σειρά της οποίας η λίστα ευρετηρίων ξεκινά από το 10 και τελειώνει στο 21, που σημαίνει ότι η σειρά έχει 21 τιμές.

Η σειρά θα μετατραπεί σε μορφή CSV με τη μέθοδο 'Series.to_csv()'.

Έχουμε χρησιμοποιήσει τη μέθοδο 'Series.to_csv()' με τη σειρά μας 'Turkey'. Ως εκ τούτου, αυτή η μέθοδος θα λάβει τις τιμές από τη σειρά 'Turkey' και θα τις μετατρέψει σε μια μορφή τιμών διαχωρισμένων με κόμματα. Το αποτέλεσμα αποθηκεύεται στη μεταβλητή 'Converted_csv'. Και τελικά, η σειρά που έχει μετατραπεί εκτυπώνεται με τη βοήθεια της συνάρτησης 'print()'.

Στο στιγμιότυπο του αποτελέσματος παρακάτω, μπορείτε να δείτε ότι οι τιμές της σειράς έχουν πλέον αλλάξει με τρόπο όπου χρησιμοποιείται κόμμα για να τις διαχωρίσει από τη λίστα ευρετηρίου. Επιπλέον, όπου λείπουν οι τιμές, μόνο ο αριθμός ευρετηρίου τυπώνεται με κόμμα.

συμπέρασμα

Η τροποποίηση μιας σειράς pandas σε μορφή CSV είναι μια πρακτική προσέγγιση. Αυτό μπορεί να επιτευχθεί χρησιμοποιώντας τη συνάρτηση 'Series.to_csv()' των pandas. Αυτός ο οδηγός έφερε στην πράξη δύο τεχνικές για την εφαρμογή αυτής της μεθόδου. Στην πρώτη εικόνα, χρησιμοποιήσαμε αυτήν τη μέθοδο για να μετατρέψουμε μια σειρά με δείκτη ημερομηνίας χρόνου σε μια μορφή τιμών διαχωρισμένων με κόμματα. Η 2η παρουσία χρησιμοποίησε τη συνάρτηση 'Series.to_csv()'   για να τροποποιήσει μια σειρά με ορισμένες καταχωρίσεις που λείπουν σε μια μορφή CSV. Και οι δύο τεχνικές έχουν εφαρμοστεί πρακτικά χρησιμοποιώντας το εργαλείο 'Spyder' στο λειτουργικό σύστημα Windows.