Ποιοι είναι οι τύποι δεδομένων Amazon Redshift;

Poioi Einai Oi Typoi Dedomenon Amazon Redshift



Το Amazon Redshift είναι μια λύση cloud που προσφέρεται από την AWS που εκπληρώνει το σκοπό μιας αποθήκης δεδομένων. Μια αποθήκη δεδομένων είναι ένας μεγάλος χώρος στο cloud που αποθηκεύει τεράστιες ποσότητες δεδομένων. Η διαφορά μεταξύ μιας αποθήκης δεδομένων και μιας βάσης δεδομένων είναι ότι η πρώτη δεν αποθηκεύει μόνο τα τρέχοντα δεδομένα αλλά και το πλήρες ιστορικό των δεδομένων.

Αυτό το άρθρο θα μάθει για το Amazon Redshift by AWS και τους τύπους δεδομένων που υποστηρίζει αυτή η υπηρεσία.







Τι είναι το Amazon RedShift;

Είναι μια λύση cloud για την αποθήκευση δεδομένων που βασίζεται σε «PostgreSQL» . Χρησιμοποιεί μια τεχνολογία που ονομάζεται «Μαζική παράλληλη επεξεργασία (MPP)» να επεξεργάζεται petabyte δεδομένων με αστραπιαίες ταχύτητες. Αυτό παρέχει μια εύκολη λύση για πρόβλεψη σε πραγματικό χρόνο με βάση ιστορικά δεδομένα και λύσεις ροής.



Το παρακάτω σχήμα δείχνει τον μηχανισμό λειτουργίας του Amazon Redshift:







Αυτή η γραφική εξήγηση του πώς λειτουργεί το Amazon Redshift είναι πολύ απλή και ξεκάθαρη. Μας δίνει πληροφορίες σχετικά με τον τρόπο ανάκτησης και περαιτέρω επεξεργασίας δεδομένων για τη δημιουργία αποτελεσμάτων και τη δημιουργία εφαρμογών που βασίζονται σε δεδομένα.

Η αρχιτεκτονική της αποθήκης δεδομένων του Amazon Redshift φαίνεται επίσης στο παρακάτω σχήμα:



Τώρα, θα κατευθυνθούμε στις χρήσεις και τα χαρακτηριστικά αυτής της υπηρεσίας.

Χαρακτηριστικά

Όπως αναφέρθηκε ήδη, το Amazon Redshift βασίζεται στην PostgreSQL και χρησιμοποιεί μια τεχνολογία που ονομάζεται Massively Parallel Processing που του επιτρέπει να επεξεργάζεται petabyte δεδομένων σε χρόνο μηδέν. Επομένως, το Redshift προσφέρει έναν καλό αριθμό χαρακτηριστικών και χρήσεων. Μερικά από αυτά τα χαρακτηριστικά είναι παρακάτω:

  • Ασφάλεια δεδομένων και κρυπτογράφηση.
  • Business Analytics.
  • Υποστήριξη εφαρμογών βάσει δεδομένων.
  • Προγνωστική Ανάλυση.
  • Αυτοματοποιημένη επανάληψη εργασιών.
  • Ταυτόχρονη κλιμάκωση δεδομένων.
  • Αποθήκευση Δεδομένων.

Ορισμένα επιπλέον χαρακτηριστικά αυτής της υπηρεσίας φαίνονται στο παρακάτω σχήμα:

Αυτές ήταν οι περισσότερες από τις δυνατότητες που προσφέρει το Redshift και τώρα θα προχωρήσουμε στους τύπους δεδομένων που υποστηρίζονται από αυτήν την υπηρεσία.

Τύποι Δεδομένων

Το Amazon Redshift είναι μια λύση αποθήκευσης δεδομένων με μεγάλο αριθμό λειτουργιών. Υποστηρίζει τόσο δομημένους όσο και μη δομημένους τύπους δεδομένων. Καθώς βασίζεται στην PostgreSQL, τα δεδομένα μπορούν να χειριστούν μέσω απλών ερωτημάτων SQL.

Τώρα, τίθεται ένα άλλο ερώτημα, δηλαδή πώς διαφέρουν αυτές οι μορφές δεδομένων μεταξύ τους; Ας συζητήσουμε αυτές τις δύο μορφές δεδομένων.

Δομημένα Δεδομένα

Ένας εξαιρετικά μορφοποιημένος τύπος δεδομένων που μεταφράζεται εύκολα από αλγόριθμους μηχανικής μάθησης ονομάζεται δομημένα δεδομένα. Μια βάση δεδομένων SQL λειτουργεί με δομημένα δεδομένα. Τα δομημένα δεδομένα είναι σε μορφή πίνακα, όπως τα δεδομένα που χρησιμοποιούνται από σχεσιακές βάσεις δεδομένων

Ένα από τα ευρέως χρησιμοποιούμενα συστήματα διαχείρισης βάσεων δεδομένων SQL είναι το MYSQL. Η αρχιτεκτονική του φαίνεται παρακάτω στο σχήμα:

Μη δομημένα δεδομένα

Τα μη δομημένα δεδομένα είναι λιγότερο μοτίβα και λιγότερα μορφοποιούνται δεδομένα, όπως δεδομένα που χρησιμοποιούνται σε μη σχεσιακές βάσεις δεδομένων. Το MongoDB είναι μια διάσημη μη σχεσιακή βάση δεδομένων. Τα ερωτήματα SQL δεν λειτουργούν σε μη σχεσιακές βάσεις δεδομένων, επομένως αυτές οι βάσεις δεδομένων ονομάζονται επίσης βάσεις δεδομένων NoSQL.

Όπως ήδη αναφέρθηκε, το MongoDB είναι ένα μη δομημένο σύστημα διαχείρισης βάσεων δεδομένων και η αρχιτεκτονική του φαίνεται παρακάτω στο σχήμα:

Εξετάσαμε τους δύο βασικούς τύπους δεδομένων που χρησιμοποιούνται στις βάσεις δεδομένων και τώρα θα κατευθυνθούμε στους πραγματικούς τύπους δεδομένων που υποστηρίζονται από το Amazon Redshift. Αυτοί οι τύποι δεδομένων είναι:

  • Αριθμητικά δεδομένα
  • Δεδομένα χαρακτήρων
  • Δεδομένα ημερομηνίας ώρας
  • Δεδομένα Boolean
  • Δεδομένα HLLSKETCH
  • ΣΟΥΠΕΡ Δεδομένα
  • Στοιχεία ΑΝΤΙΚΑΤΑΣΤΑΣΗΣ

Ας συζητήσουμε αυτούς τους τύπους δεδομένων:

Αριθμητικά δεδομένα

Αυτός ο τύπος δεδομένων είναι αυτονόητος. Υποστηρίζει δεδομένα που έχουν τη μορφή ακεραίων, δεκαδικών, κινητής υποδιαστολής και άλλων τύπων αριθμητικών δεδομένων.

Τα χαρακτηριστικά του ακέραιου τύπου δεδομένων φαίνονται στο παρακάτω σχήμα:

Ο δεκαδικός τύπος δεδομένων αποθηκεύει τα δεδομένα με βάση την ακρίβεια από τον χρήστη. Τα χαρακτηριστικά του είναι τα εξής:

Δεδομένα χαρακτήρων

Οι τύποι δεδομένων CHAR και VARCHAR εμπίπτουν στην κατηγορία των τύπων δεδομένων που βασίζονται σε χαρακτήρες. Τα NCHAR και NVARCHAR είναι επίσης τύποι δεδομένων τύπου χαρακτήρων. Σε αντίθεση με το CHAR και το VARCHAR, αυτοί οι δύο τύποι δεδομένων αποθηκεύουν χαρακτήρες σταθερού μήκους Unicode. Ας δούμε τις ιδιότητες αυτών των τύπων δεδομένων, όπως:

  • CHAR, CHARACTER, NCHAR έχουν εύρος 4KB.
  • Το VARCHAR, το NVARCHAR έχει εμβέλεια 64KB.
  • Το BPCHAR έχει εύρος 256 Byte.
  • Το TEXT έχει εύρος 260 Byte.

Δεδομένα ημερομηνίας ώρας

Οι τύποι δεδομένων ημερομηνίας είναι DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Οι λειτουργικές δυνατότητες αυτών των τύπων δεδομένων είναι οι εξής:

  • Το DATE αποθηκεύει απλώς ημερολογιακές ημερομηνίες.
  • Το TIME αποθηκεύει την ώρα χωρίς αναφορά σε οποιαδήποτε ζώνη ώρας. Είναι UTC, από προεπιλογή.
  • Το TIMETZ αποθηκεύει την ώρα σε σχέση με τη ζώνη ώρας. Είναι UTC τόσο στους πίνακες χρηστών όσο και στους πίνακες συστήματος, από προεπιλογή.
  • Το TIMESTAMP δεν περιλαμβάνει μόνο την ώρα αλλά και τις ημερομηνίες. Είναι UTC και στους πίνακες χρηστών και στους πίνακες συστήματος, από προεπιλογή.
  • Το TIMESTAMPTZ δεν περιλαμβάνει μόνο την ώρα αλλά και τις ημερομηνίες. Είναι UTC μόνο σε πίνακες χρηστών, από προεπιλογή.

Δεδομένα Boolean

Ο τύπος δεδομένων Boole είναι ένας δυαδικός τύπος δεδομένων, που σημαίνει ότι υπάρχουν μόνο δύο τιμές. Ο πίνακας χαρακτηριστικών για τον τύπο δεδομένων Boolean δίνεται παρακάτω στο σχήμα:

Δεδομένα HLLSKETCH

Αυτός ο τύπος δεδομένων χρησιμοποιείται για την αποθήκευση σκίτσων. Το Redshift μπορεί να αναπαριστά τα σκίτσα είτε σε αραιή είτε σε πυκνή μορφή. Τα σκίτσα ξεκινούν ως αραιά και σταδιακά γίνονται πυκνά όταν μια πυκνή μορφή παρέχει μεγαλύτερη αποτελεσματικότητα ακολουθώντας τον σύνδεσμο.

ΣΟΥΠΕΡ Δεδομένα

Αυτός ο τύπος δεδομένων ασχολείται με μη δομημένα δεδομένα που μπορεί να έχουν τη μορφή πινάκων, ένθετων δομών ή JSON. Δεν υπάρχει μοντέλο ή μορφή των δεδομένων. Οι χρήστες μπορούν να εξερευνήσουν περισσότερες πληροφορίες πλοηγώντας στον σύνδεσμο.

Στοιχεία ΑΝΤΙΚΑΤΑΣΤΑΣΗΣ

Αυτός ο τύπος δεδομένων αποθηκεύει επίσης χαρακτήρες. Ωστόσο, το μήκος είναι περιορισμένο. Το Amazon Redshift επιτρέπει τη μετάδοση δεδομένων VARBYTE σε οποιονδήποτε τύπο ακέραιου ή τύπου χαρακτήρων. Για περισσότερες πληροφορίες σχετικά με αυτόν τον τύπο δεδομένων, ακολουθήστε τον παρακάτω σύνδεσμο.

Αυτό είναι το μόνο που υπάρχει για το Amazon Redshift και τους τύπους δεδομένων που υποστηρίζει.

συμπέρασμα

Το Amazon Redshift είναι μια υπηρεσία AWS που στη βασική της μορφή εξυπηρετεί τον σκοπό μιας αποθήκης δεδομένων, αλλά είναι μια πολύ ισχυρή και χαρακτηριστική λύση για ανάλυση και πρόβλεψη. Αυτό το άρθρο έχει συζητήσει το Redshift και τους τύπους δεδομένων που υποστηρίζει. Αυτοί οι τύποι δεδομένων επεξηγήθηκαν συνοπτικά μαζί με τα χαρακτηριστικά τους.