Πώς να δημιουργήσετε ένα πρόγραμμα ανίχνευσης για λήψη δεδομένων από τον κάδο S3;

Pos Na Demiourgesete Ena Programma Anichneuses Gia Lepse Dedomenon Apo Ton Kado S3



Το AWS Glue χρησιμοποιείται για την ανακάλυψη δεδομένων, την ενοποίηση δεδομένων, την ανίχνευση δεδομένων και τη δημιουργία ενός καταλόγου δεδομένων στο cloud. Ο χρήστης μπορεί να δημιουργήσει ένα πρόγραμμα ανίχνευσης από το AWS Glue που θα ανιχνεύει δεδομένα από τη δεδομένη πηγή και στη συνέχεια θα τα αποθηκεύει στον κατάλογο δεδομένων για να αποκτήσει πληροφορίες. Ο χρήστης πρέπει μόνο να εκτελέσει το πρόγραμμα ανίχνευσης και όλα τα άλλα θα εκτελεστούν από τον ανιχνευτή μέσα σε λίγα λεπτά.

Αυτός ο οδηγός θα εξηγήσει πώς να δημιουργήσετε ανιχνευτές για την ανάκτηση δεδομένων από τον κάδο S3.

Πώς να δημιουργήσετε πρόγραμμα ανίχνευσης για να λάβετε δεδομένα από τον κάδο S3;

Για να δημιουργήσετε έναν ανιχνευτή στο AWS, επισκεφτείτε το ' Κόλλα AWS ” υπηρεσία από τον πίνακα ελέγχου της Amazon:









Κάνε κλικ στο ' Βάσεις δεδομένων κουμπί ” από την ενότητα Κατάλογος δεδομένων για να δημιουργήσετε μια βάση δεδομένων:







Κάνε κλικ στο ' Προσθήκη βάσης δεδομένων κουμπί ” για να ξεκινήσει η διαμόρφωση:



Εισαγάγετε το όνομα της βάσης δεδομένων και αφήστε τα πάντα όπως είναι προαιρετικά πριν κάνετε κλικ στο ' Δημιουργία βάσης δεδομένων Κουμπί ”:

Η βάση δεδομένων δημιουργήθηκε με επιτυχία:

Μετά από αυτό, απλώς κατευθυνθείτε στο ' Ανιχνευτές ” σελίδα κάνοντας κλικ σε αυτήν από τον αριστερό πίνακα:

Κάνε κλικ στο ' Δημιουργία ανιχνευτή Κουμπί ”:

Πληκτρολογήστε το όνομα του ανιχνευτή και κάντε κλικ στο ' Επόμενο Κουμπί ”:

Κάνε κλικ στο ' Προσθέστε μια πηγή δεδομένων κουμπί ” για να επιλέξετε την πηγή των δεδομένων:

Για να ελέγξετε τη διαδρομή όπου είναι αποθηκευμένα τα δεδομένα, επισκεφτείτε την υπηρεσία S3:

Κατευθυνθείτε στον κάδο S3 όπου ανεβαίνουν τα δεδομένα. Ο χρήστης μπορεί δημιουργώ έναν κουβά και μεταφόρτωση δεδομένα σε αυτό από τον πίνακα εργαλείων AWS S3:

Κάνε κλικ στο ' Περιηγηθείτε στο S3 κουμπί ” για να επιλέξετε τη διαδρομή των δεδομένων:

Επιλέξτε το φάκελο που περιέχει τα δεδομένα και, στη συνέχεια, κάντε κλικ στο ' Επιλέγω Κουμπί ”:

Η διαδρομή S3 έχει επιλεγεί, τώρα κάντε κλικ στο ' Προσθέστε μια πηγή δεδομένων S3 Κουμπί ”:

Μόλις προστεθεί η πηγή δεδομένων, απλώς κάντε κλικ στο ' Επόμενο Κουμπί ”:

Προσθέστε τον ρόλο IAM και, στη συνέχεια, κάντε κλικ στο ' Επόμενο Κουμπί ”:

Εισαγάγετε τη βάση δεδομένων προορισμού που δημιουργήθηκε νωρίτερα και, στη συνέχεια, πληκτρολογήστε το όνομα για τον πίνακα:

Επιλέξτε το πρόγραμμα κατ' απαίτηση για τον ανιχνευτή και κάντε κλικ στο ' Επόμενο Κουμπί ”:

Ελέγξτε τον ανιχνευτή και κάντε κλικ στο ' Δημιουργία ανιχνευτή Κουμπί ”:

Ο ανιχνευτής δημιουργήθηκε με επιτυχία, κάντε κλικ στο ' Τρέξιμο κουμπί ” αφού το επιλέξετε:

Θα χρειαστούν μερικά λεπτά για την εκτέλεση του προγράμματος ανίχνευσης και θα ανακτήσει δεδομένα και θα δημιουργήσει έναν πίνακα για την αποθήκευση των δεδομένων:

Κατευθυνθείτε στο ' Πίνακες » σελίδα από τον πίνακα ελέγχου Glue:

Επιλέξτε τον πίνακα κάνοντας κλικ στο όνομά του:

Οι λεπτομέρειες της ιστορίας έχουν εμφανιστεί που περιέχουν τα μεταδεδομένα των δεδομένων που έχουν ληφθεί:

Κάντε κύλιση προς τα κάτω στη σελίδα και επιλέξτε την ενότητα για να προβάλετε τον πίνακα που περιέχει τα δεδομένα:

Αυτό αφορά τη δημιουργία ενός ανιχνευτή για την ανάκτηση δεδομένων από τον κάδο S3.

συμπέρασμα

Για να δημιουργήσετε ένα πρόγραμμα ανίχνευσης για την ανάκτηση δεδομένων από τον κάδο S3, δημιουργήστε μια βάση δεδομένων στο AWS Glue στην οποία θα αποθηκευτούν τα ανιχνευμένα δεδομένα. Διαμορφώστε το πρόγραμμα ανίχνευσης από τον πίνακα ελέγχου Glue παρέχοντας την πηγή δεδομένων (κάδος S3) και τη βάση δεδομένων προορισμού. Εκτελέστε το πρόγραμμα ανίχνευσης και ανακτήστε τα δεδομένα από τον κάδο S3 στον πίνακα βάσης δεδομένων, όπως έχει εξηγήσει διεξοδικά αυτός ο οδηγός.