Τι είναι το VisualGPT – Όλα όσα πρέπει να γνωρίζετε

Ti Einai To Visualgpt Ola Osa Prepei Na Gnorizete



Το VisualGPT της Microsoft κυκλοφορεί μια νέα τεχνολογία ' VisualGPT Αυτό είναι μια πρόοδος της τεχνητής νοημοσύνης και ξεκλειδώνει δυνατότητες για πιο ελκυστικές και διαδραστικές εμπειρίες τεχνητής νοημοσύνης γεφυρώνοντας το χάσμα μεταξύ των οπτικών και της γλώσσας.

Τι είναι το VisualGPT;

Το VisualGPT είναι μια εκτεταμένη έκδοση του ChatGPT που βασίζεται σε μοντέλα NLP (Natural Language Processing), αλλά στο VisualGPT χρησιμοποιείται VFMS που μπορεί να μετατρέψει ερωτήματα κειμένου σε μορφή εικόνας. Είναι τέτοιο που είναι ένας συνδυασμός/ενσωμάτωση ερωτημάτων κειμένου και εικόνας.







Σκοπός του VisualGPT

Μετά την κυκλοφορία του ChatGPT στην αγορά που εργαζόταν στη μορφή κειμένου ως το μοναδικό, για να επιτευχθεί το επόμενο επίπεδο προόδου, υπάρχει το τέλειο εργαλείο που θα λειτουργήσει σε μορφή κειμένου σε γραφικό, ακολουθώντας όλους αυτούς τους λόγους και στον αγώνα για την τεχνητή νοημοσύνη πρόοδος Η Microsoft κυκλοφορεί το VisualGPT Ο κύριος σκοπός του VisualGPT είναι η δημιουργία εικόνων AI κατόπιν αιτήματος των χρηστών ή η ανάλυση της εικόνας



Αρχιτεκτονική του VisualGPT

Το VisualGPT περιέχει το Ερώτημα χρήστη, το Prompt Manager, τα Visual Foundation Models (VFM), την Αρχή Συστήματος, το Ιστορικό του Διαλόγου, το Ιστορικό Συλλογισμού και την Ενδιάμεση Απάντηση.



Αν μιλάμε συγκεκριμένα για το μοντέλο του, π.χ. VFM (Visual Foundation Models) », χρησιμοποιούνται σχεδόν 22 VFM, όπως το BLIP (Bootstrapping Language-Image Pre-training) και το Stable Diffusion.





Πώς να εκτελέσετε ένα Visual ChatGPT;

Για να εκτελέσετε ένα Visual ChatGPT, ακολουθήστε τα ακόλουθα βήματα:

Βήμα 1: Δημιουργήστε ένα περιβάλλον

Αρχικά, πρέπει να δημιουργήσετε ένα περιβάλλον Python έκδοσης 3.8:



εισαγωγής συστήματος

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

Βήμα 2: Κλωνοποίηση αρχείου Visual ChatGPT

Τώρα, κλωνοποιήστε το οπτικό αρχείο ChatGPT από το GitHub χρησιμοποιώντας την ακόλουθη εντολή:

! git κλώνος https: // github.com / deepanshu88 / visual-chatgpt.git

Βήμα 3: Ρύθμιση νέου καταλόγου

Μετά από αυτό, δημιουργήστε έναν νέο κατάλογο μέσω της παρακάτω εντολής:

% CD visual-chatgpt

Βήμα 4: Εγκαταστήστε τα απαιτούμενα πακέτα

Τώρα, εγκαταστήστε τα απαιτούμενα πακέτα χρησιμοποιώντας το ' κουκούτσι ” cmdlet:

! μπούκλα https: // bootstrap.pypa.io / get-pip.py get-pip.py

! python3.8 get-pip.py

! python3.8 κουκούτσι εγκαθιστώ -r απαιτήσεις.txt

Βήμα 5: Πρόσβαση στο OpenAI API

Μετά την εγκατάσταση των αρχικών πακέτων, αποκτήστε πρόσβαση στο OpenAI API αποκτώντας ένα κλειδί API από το 'platform.openai.com' και πραγματοποιώντας επαληθευμένες κλήσεις API:

% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

Βήμα 6: Επιλέξτε το μοντέλο

Τέλος, μετά την πρόσβαση στο Openai επιλέξτε το μοντέλο, υπάρχουν περισσότερα από 20 μοντέλα που χρησιμοποιούνται στο visualGPT που μπορείτε να επιλέξετε σύμφωνα με τις απαιτήσεις σας:

! python3.8. / visual_chatgpt.py --φορτώνω Text2Image_cuda: 0

Στην παραπάνω εντολή, ' Κείμενο2Εικόνα ” αντιστοιχεί στο μοντέλο που θα χρησιμοποιηθεί. Για περισσότερες λεπτομέρειες, ελέγξτε αυτό το Google Colab σημειωματάριο .

συμπέρασμα

Το ChatGPT εισήχθη για να λαμβάνει συγκεκριμένες απαντήσεις σχετικά με οποιοδήποτε ερώτημα και τώρα η Microsoft κυκλοφόρησε το VisualGPT το οποίο είναι σε θέση να χειρίζεται δεδομένα κειμένου καθώς και εικαστικά. Είναι τέτοιο που ο χρήστης μπορεί απλά να προσθέσει τις απαιτήσεις του σε μορφή κειμένου και να πάρει τη γραφική του έξοδο.