Τι είναι το Amazon Redshift Data Warehouse Architecture;

Ti Einai To Amazon Redshift Data Warehouse Architecture



Η φιλοξενία και η διαχείριση δεδομένων σε βάσεις δεδομένων και αποθήκες δεδομένων ήταν πάντα μια ταραχώδης και ενοχλητική εργασία. Απαιτεί πολλούς πόρους και υπολογιστική ισχύ για να κατανοήσετε τα δεδομένα. Η Amazon Web Services έχει μια ενιαία λύση για αυτόν τον σκοπό. Διαθέτει μια υπηρεσία που ονομάζεται Amazon Redshift που διαχειρίζεται πλήρως τις αποθήκες δεδομένων των χρηστών.

Αυτό το άρθρο θα εξηγήσει λεπτομερώς το Amazon Redshift μαζί με την αρχιτεκτονική της αποθήκης δεδομένων. Όλα τα στοιχεία της αρχιτεκτονικής του συστήματος αποθήκης δεδομένων του Redshift θα εξηγηθούν λεπτομερώς.







Τι είναι το Amazon Redshift;

Το IT είναι μια υπηρεσία αποθήκευσης δεδομένων που παρέχεται από την Amazon. Διαχειρίζεται και αναλύει αποτελεσματικά μεγάλα σύνολα δεδομένων για αναλύσεις και αναφορές. Είναι χτισμένο σε κιονοειδή αποθηκευτικό μοντέλο. Χρησιμοποιεί συμπλέγματα υπολογιστικών κόμβων που ελέγχονται από έναν κόμβο ηγέτη για την παροχή επεξεργασίας δεδομένων υψηλής απόδοσης.



Παίρνει δεδομένα από διαφορετικές πηγές και τα συγκεντρώνει για να δημιουργήσει μια αποθήκη δεδομένων. Προσφέρει διαφορετικές δυνατότητες, όπως κοινή χρήση δεδομένων και αναλύσεις σε πραγματικό χρόνο. Δείτε την παρακάτω εικόνα για να κατανοήσετε τα χαρακτηριστικά και τις δυνατότητες του Amazon Redshift:







Ας κατευθυνθούμε τώρα στην αρχιτεκτονική του συστήματος αποθήκης δεδομένων.

Τι είναι το Amazon Redshift Data Warehouse Architecture;

Αυτή η αρχιτεκτονική συστήματος έχει τρία βασικά μέρη. Αυτά τα μέρη είναι:



  • Αποθήκευση
  • Επιτάχυνση
  • Υπολογισμός

Ας κατανοήσουμε τους σκοπούς τους:

Αποθήκευση
Το μέρος αποθήκευσης αφορά τις υπηρεσίες αποθήκευσης που διαθέτει το Redshift. Διαθέτει τη δική του επιλογή υπηρεσίας διαχείρισης αποθήκευσης καθώς και μια επιλογή κάδου S3.

Επιτάχυνση
Το τμήμα της επιτάχυνσης εξαρτάται από την υπηρεσία αποθήκευσης που χρησιμοποιείται και την υπολογιστική ισχύ που χρησιμοποιείται. Ο χώρος αποθήκευσης που διαχειρίζεται το Redshift είναι ταχύτερος σε σύγκριση με άλλες επιλογές αποθήκευσης

Υπολογισμός
Το μέρος του υπολογισμού ασχολείται καθαρά με την υπολογιστική ισχύ σε χρήση. Ο υπολογισμός γίνεται με συστάδες και οι συστάδες έχουν κόμβους. Οι κόμβοι με τη σειρά τους έχουν φέτες.

Για να κατανοήσετε καλύτερα όλα τα στοιχεία και τα συστατικά αυτής της αρχιτεκτονικής, δείτε την παρακάτω εικόνα:

Ας κατανοήσουμε τα συστατικά του ένα προς ένα.

Ποια είναι τα αρχιτεκτονικά στοιχεία του Amazon Redshift;

Τα παρακάτω είναι τα αρχιτεκτονικά στοιχεία του Amazon Redshift:

  • Συστάδες
  • Κόμβοι
  • Φέτες κόμβων
  • Αποθήκευση
  • Εσωτερικό Δίκτυο
  • Βάσεις δεδομένων

Ας τα συζητήσουμε ένα προς ένα:

Συστάδες
Ένα σύμπλεγμα είναι η θεμελιώδης και βασική μονάδα. Περιλαμβάνει έναν αριθμό κόμβων. Εάν ένα σύμπλεγμα αποτελείται από πολλούς υπολογιστικούς κόμβους, ένας πρόσθετος κόμβος οδηγός εισέρχεται για να συντονίσει τις δραστηριότητες αυτών των κόμβων υπολογιστών και να διαχειριστεί την εξωτερική επικοινωνία.

Κόμβοι

Οι κόμβοι σε συστάδες είναι δύο τύπων. Αυτά είναι:

  • Κόμβος Leader
  • Υπολογιστικός Κόμβος

Ας τα καταλάβουμε αυτά ένα προς ένα:

Κόμβος Leader
Διαχειρίζεται την επικοινωνία με προγράμματα-πελάτες και συντονίζει τις αλληλεπιδράσεις με τους κόμβους υπολογιστών. Ο κόμβος οδηγός παίζει ζωτικό ρόλο στην εκτέλεση σύνθετων ερωτημάτων. Μεταγλωττίζει κώδικα με βάση το σχέδιο εκτέλεσης που διανέμεται σε κόμβους υπολογισμού και εκχωρεί τμήματα δεδομένων σε κάθε μεμονωμένο υπολογιστικό κόμβο.

Υπολογιστικός Κόμβος
Οι υπολογιστικοί κόμβοι είναι η ραχοκοκαλιά της αρχιτεκτονικής του Amazon Redshift. Πραγματοποιούν τόσο αποθήκευση όσο και επεξεργασία δεδομένων. Αυτά έχουν αποκλειστικούς πόρους, όπως μνήμη και CPU.

Φέτες κόμβων
Οι υπολογιστικοί κόμβοι χωρίζονται περαιτέρω σε φέτες. Αυτά τα τμήματα συνεργάζονται για την επεξεργασία των εκχωρημένων φόρτων εργασίας και την επίτευξη παραλληλισμού για τη βελτίωση της επεξεργασίας ερωτημάτων.

Αποθήκευση
Η διαχείριση της αποθήκευσης δεδομένων στο Amazon Redshift γίνεται από το 'Redshift Managed Storage (RMS)'. Έχει τη δυνατότητα να κλιμακώνει τον χώρο αποθήκευσης ανεξάρτητα χρησιμοποιώντας την αποθήκευση «Amazon S3». Το RMS χρησιμοποιεί τοπική αποθήκευση υψηλής απόδοσης που βασίζεται σε SSD ως κρυφή μνήμη επιπέδου 1 που βελτιστοποιεί την απόδοση.

Εσωτερικό Δίκτυο
Αυτό το εσωτερικό δίκτυο στο Amazon Redshift βοηθά στη γρήγορη και ασφαλή επικοινωνία μεταξύ κόμβων οδηγών και κόμβων υπολογιστών. Αυτό το δίκτυο δεν είναι άμεσα προσβάσιμο σε εφαρμογές πελάτη.

Βάσεις δεδομένων
Τα συμπλέγματα έχουν μία ή περισσότερες βάσεις δεδομένων. Τα δεδομένα από αυτές τις βάσεις δεδομένων βρίσκονται σε κόμβους υπολογιστών. Οι εφαρμογές πελάτη επικοινωνούν με τον κόμβο οδηγό. Ο κόμβος υπολογισμού διαχειρίζεται την εκτέλεση ερωτήματος μεταξύ των κόμβων υπολογιστών.

Όλα αυτά αφορούν το Amazon Redshift και τα αρχιτεκτονικά του στοιχεία. Αυτό το άρθρο έχει εξηγήσει αναλυτικά τα λειτουργικά στοιχεία του Amazon Redshift

συμπέρασμα

Η αρχιτεκτονική του Amazon Redshift είναι ο λόγος για τον οποίο βασίζονται οι δυνατότητές του. Ο κόμβος οδηγός ελέγχει και διαχειρίζεται τους υπολογιστικούς κόμβους και οι τομές κόμβων βοηθούν στην παράλληλη επεξεργασία. Το Redshift Managed Storage χρησιμοποιεί χώρο αποθήκευσης που βασίζεται σε SSD για τη βελτίωση της απόδοσης. Αυτό το άρθρο έχει εξηγήσει την Αρχιτεκτονική του συστήματος αποθήκης δεδομένων Amazon Redshift.