Πώς να διαβάσετε το αρχείο excel (xlsx) σε python

How Read Excel File Python



ο .xlsx είναι η επέκταση του εγγράφου excel που μπορεί να αποθηκεύσει μεγάλο όγκο δεδομένων σε μορφή πίνακα και πολλοί τύποι αριθμητικών και λογικών υπολογισμών μπορούν να γίνουν εύκολα σε ένα υπολογιστικό φύλλο excel. Μερικές φορές απαιτείται η ανάγνωση των δεδομένων από το έγγραφο excel χρησιμοποιώντας το σενάριο Python για σκοπούς προγραμματισμού. Υπάρχουν πολλές ενότητες στην Python για την ανάγνωση του εγγράφου excel. Μερικές από τις χρήσιμες ενότητες είναι xlrd , openpyxl , και παντα Το Οι τρόποι χρήσης αυτών των ενοτήτων για την ανάγνωση του αρχείου excel στην Python παρουσιάζονται σε αυτό το σεμινάριο.

Προαπαιτούμενο:

Ένα εικονικό αρχείο excel με την επέκταση .xlsx θα χρειαστεί για να ελέγξετε τα παραδείγματα αυτού του σεμιναρίου. Μπορείτε να χρησιμοποιήσετε οποιοδήποτε υπάρχον αρχείο excel ή να δημιουργήσετε ένα νέο. Εδώ, ένα νέο αρχείο excel με όνομα sales.xlsx το αρχείο έχει δημιουργηθεί με τα ακόλουθα δεδομένα. Αυτό το αρχείο χρησιμοποιήθηκε για ανάγνωση χρησιμοποιώντας διαφορετικές ενότητες python στο επόμενο μέρος αυτού του σεμιναρίου.







sales.xlsx



Ημερομηνία πώλησης Πωλητής Ποσό
05/12/18 Σίλα Αχμέτ 60000
12/06/19 Εγώ Χοσεΐν 50.000
08/09/20 Σαρμίν Τζαχάν 45000
04/07/21 Μαχμούντουλ Χασάν 30000

Παράδειγμα-1: Διαβάστε το αρχείο excel χρησιμοποιώντας το xlrd

Η μονάδα xlrd δεν είναι εγκατεστημένη με την Python από προεπιλογή. Έτσι, πρέπει να εγκαταστήσετε τη μονάδα πριν τη χρησιμοποιήσετε. Η τελευταία έκδοση αυτής της ενότητας δεν υποστηρίζει το αρχείο excel με την επέκταση .xlsx. Έτσι, πρέπει να εγκαταστήσετε την έκδοση 1.2.0 αυτής της ενότητας για να διαβάσετε το αρχείο xlsx. Εκτελέστε την ακόλουθη εντολή από το τερματικό για να εγκαταστήσετε την απαιτούμενη έκδοση xlrd Το



$κουκούτσιεγκαθιστώ xlrd== 1.2.0

Αφού ολοκληρώσετε τη διαδικασία εγκατάστασης, δημιουργήστε ένα αρχείο python με το ακόλουθο σενάριο για να διαβάσετε το sales.xlsx αρχείο χρησιμοποιώντας το xlrd μονάδα μέτρησης. open_workbook () συνάρτηση χρησιμοποιείται στο σενάριο ανοίξτε το αρχείο xlsx για ανάγνωση. Αυτό το αρχείο excel περιέχει μόνο ένα φύλλο. Ετσι το workbook.sheet_by_index () η συνάρτηση έχει χρησιμοποιηθεί στο σενάριο με την τιμή του ορίσματος 0. Στη συνέχεια, το ένθετο 'Για' Ο βρόχος έχει χρησιμοποιηθεί για την ανάγνωση των τιμών κελιού του φύλλου εργασίας χρησιμοποιώντας τις τιμές γραμμής και στήλης. Δύο συναρτήσεις εύρους () έχουν χρησιμοποιηθεί στο σενάριο για τον καθορισμό του μεγέθους της γραμμής και της στήλης με βάση τα δεδομένα φύλλου. ο τιμή_κυττάρων () η συνάρτηση έχει χρησιμοποιηθεί για την ανάγνωση της συγκεκριμένης τιμής κελιού του φύλλου σε κάθε επανάληψη του βρόχου. Κάθε πεδίο στην έξοδο θα χωρίζεται με έναν χώρο καρτέλας.





# Εισαγάγετε την ενότητα xlrd
εισαγωγή xlrd

# Ανοίξτε το τετράδιο εργασίας
βιβλίο εργασίας = xlrd.open_bookbook('sales.xlsx')

# Ανοίξτε το φύλλο εργασίας
φύλλο εργασίας = workbook.sheet_by_index(0)

# Επαναλάβετε τις γραμμές και τις στήλες
ΓιαΕγώσεεύρος(0,5):
Γιαισεεύρος(0,3):
# Εκτυπώστε τις τιμές κελιού με χώρο καρτέλας
Τυπώνω(φύλλο εργασίας.κυτταρική_αξία(εγώ, j),τέλος=' t')
Τυπώνω('')

Παραγωγή:

Η ακόλουθη έξοδος θα εμφανιστεί μετά την εκτέλεση του παραπάνω σεναρίου.



Παράδειγμα-2: Διαβάστε το αρχείο excel χρησιμοποιώντας το openpyxl

ο openpyxl είναι μια άλλη ενότητα python για την ανάγνωση του αρχείου xlsx και επίσης δεν είναι εγκατεστημένη με την Python από προεπιλογή. Εκτελέστε την ακόλουθη εντολή από το τερματικό για να εγκαταστήσετε αυτήν τη μονάδα πριν τη χρησιμοποιήσετε.

$κουκούτσιεγκαθιστώopenpyxl

Αφού ολοκληρώσετε τη διαδικασία εγκατάστασης, δημιουργήστε ένα αρχείο python με το ακόλουθο σενάριο για να διαβάσετε το sales.xlsx αρχείο. Όπως η ενότητα xlrd, το openpyxl η ενότητα έχει το load_workbook () λειτουργία για να ανοίξετε το αρχείο xlsx για ανάγνωση. ο sales.xlsx Το αρχείο χρησιμοποιείται ως τιμή ορίσματος αυτής της συνάρτησης. Το αντικείμενο του wookbook.active έχει δημιουργηθεί στο σενάριο για να διαβάζει τις τιμές του max_row και το max_column ιδιότητες. Αυτές οι ιδιότητες έχουν χρησιμοποιηθεί σε ένθετους βρόχους για την ανάγνωση του περιεχομένου του sales.xlsx αρχείο. Η λειτουργία εύρους () έχει χρησιμοποιηθεί για την ανάγνωση των σειρών του φύλλου και η συνάρτηση iter_cols () έχει χρησιμοποιηθεί για την ανάγνωση των στηλών του φύλλου. Κάθε πεδίο στην έξοδο θα χωρίζεται με δύο κενά καρτελών.

# Εισαγωγή ενότητας openyxl
εισαγωγή openpyxl

# Ορισμός μεταβλητής για φόρτωση του βιβλίου wook
wookbook = openpyxl.load_bookbook('sales.xlsx')

# Ορισμός μεταβλητής για ανάγνωση του ενεργού φύλλου:
φύλλο εργασίας = wookbook.active

# Επαναλάβετε το βρόχο για να διαβάσετε τις τιμές κελιού
ΓιαΕγώσεεύρος(0, φύλλο εργασίας.max_row):
Για με την σεφύλλο εργασίας.iter_cols(1, φύλλο εργασίας.max_column):
Τυπώνω(με την[Εγώ].αξία,τέλος=' t t')
Τυπώνω('')

Παραγωγή:

Η ακόλουθη έξοδος θα εμφανιστεί μετά την εκτέλεση του παραπάνω σεναρίου.

Παράδειγμα-3: Διαβάστε το αρχείο excel χρησιμοποιώντας pandas

Η μονάδα pandas δεν είναι εγκατεστημένη με την προηγούμενη μονάδα τύπου python. Έτσι, εάν δεν το εγκαταστήσατε πριν, τότε πρέπει να το εγκαταστήσετε. Εκτελέστε την ακόλουθη εντολή για να εγκαταστήσετε το παντα από το τερματικό.

$κουκούτσιεγκαθιστώπαντα

Αφού ολοκληρώσετε τη διαδικασία εγκατάστασης, δημιουργήστε ένα αρχείο python με το ακόλουθο σενάριο για να διαβάσετε το sales.xlsx αρχείο. ο read_excel () Η λειτουργία του pandas χρησιμοποιείται για την ανάγνωση του αρχείου xlsx. Αυτή η συνάρτηση έχει χρησιμοποιηθεί στο σενάριο για την ανάγνωση του sales.xlsx αρχείο. ο Πλαίσιο δεδομένων() η συνάρτηση έχει χρησιμοποιηθεί εδώ για να διαβάσει το περιεχόμενο του αρχείου xlsx στο πλαίσιο δεδομένων και να αποθηκεύσει τις τιμές στη μεταβλητή που ονομάζεται δεδομένα Το Η αξία των δεδομένων εκτυπώθηκε αργότερα.

# Εισαγάγετε pandas
εισαγωγή pandasόπως καιpd

# Φορτώστε το αρχείο xlsx
excel_data = pd.read_excel('sales.xlsx')
# Διαβάστε τις τιμές του αρχείου στο πλαίσιο δεδομένων
data = pd.DataFrame(excel_data,στήλες=[«Ημερομηνία πώλησης»,'Πωλητής','Ποσό'])
# Εκτυπώστε το περιεχόμενο
Τυπώνω(«Το περιεχόμενο του αρχείου είναι: n', δεδομένα)

Παραγωγή:

Η ακόλουθη έξοδος θα εμφανιστεί μετά την εκτέλεση του παραπάνω σεναρίου. Η έξοδος αυτού του σεναρίου είναι διαφορετική από τα δύο προηγούμενα παραδείγματα. Οι αριθμοί γραμμών εκτυπώνονται στην πρώτη στήλη, όπου η τιμή της σειράς έχει μετρηθεί από το 0. Οι τιμές ημερομηνίας ευθυγραμμίζονται κεντρικά. Τα ονόματα των πωλητών ευθυγραμμίζονται σωστά. Το ποσό ευθυγραμμίζεται αριστερά.

Συμπέρασμα:

Οι χρήστες python πρέπει να εργάζονται με αρχεία xlsx για διαφορετικούς σκοπούς προγραμματισμού. Τρεις διαφορετικοί τρόποι ανάγνωσης του αρχείου xlsx παρουσιάστηκαν σε αυτό το σεμινάριο χρησιμοποιώντας τρεις ενότητες python. Κάθε μονάδα έχει διαφορετικές λειτουργίες και ιδιότητες για την ανάγνωση του αρχείου xlsx. Αυτό το σεμινάριο θα βοηθήσει τους χρήστες python να διαβάσουν εύκολα το αρχείο xlsx χρησιμοποιώντας το σενάριο python αφού διαβάσουν αυτό το σεμινάριο.