Πέρα από το ChatGPT, υπάρχουν κι αλλού πορτοκαλιές που κάνουν πορτοκάλια

Κανένας δεν μπορεί να αμφισβητήσει ότι το ChatGPT και η εταιρεία OpenAI άλλαξαν για πάντα το τοπίο της τεχνολογίας, φέρνοντας τη Γενετική Τεχνητή Νοημοσύνη (Generative AI) από τα ακαδημαϊκά εργαστήρια στην καθημερινή ζωή δισεκατομμυρίων ανθρώπων. Η λέξη «ChatGPT» έγινε συνώνυμη του «chatbot» και του «AI», λειτουργώντας ως η μητέρα όλων των εφαρμογών Τεχνητής Νοημοσύνης για τη δημιουργία κειμένων και την αναζήτηση ιδεών.

Ωστόσο, η υπερβολική εστίαση σε αυτήν τη μία και μοναδική εφαρμογή συχνά μας κάνει να ξεχνάμε ότι υπάρχουν και άλλα εξαιρετικά καινοτόμα Μεγάλα Γλωσσικά Μοντέλα (LLMs), που ανταγωνίζονται, συμπληρώνουν ή ακόμα και υπερτερούν του ChatGPT σε πολλούς τομείς.

Η αγορά της Τεχνητής Νοημοσύνης δεν είναι μονοπώλιο. Οι κολοσσοί της τεχνολογίας, αλλά και πολλές νεοσύστατες εταιρείες, επενδύουν δισεκατομμύρια για να προσφέρουν διαφορετικές λύσεις, καθεμία με τα δικά της μοναδικά χαρακτηριστικά και φιλοσοφία. Οι εφαρμογές Τεχνητής Νοημοσύνης είναι σαν τους 7 σοφούς της Αρχαίας Ελλάδας. Καλό είναι να μη ρωτάμε μόνο έναν σοφό αλλά περισσότερους. Καθένας έχει να μας πει κάτι διαφορετικό ανάλογα με τις «γνώσεις» του και τις «πολιτικές» του.

Ο ανταγωνισμός αυτός και η πολυμορφία είναι το μεγαλύτερο δώρο για τους χρήστες. Ας γνωρίσουμε λοιπόν και τις υπόλοιπες (πέρα από το ChatGPT) εφαρμογές της Τεχνητής Νοημοσύνης.

Google Gemini: Η Δύναμη του Πολυτροπικού μοντέλου (Multimodal)

Η Google δεν θα μπορούσε να μείνει εκτός παιχνιδιού. Με το μοντέλο της Gemini, το οποίο αντικατέστησε και ενσωματώθηκε στο Bard, η εταιρεία έφερε στο προσκήνιο την έννοια της πολυτροπικότητας (multimodality). Τα βασικά του πλεονεκτήματα είναι η πολυτροπικότητα (multimodality), η ενσωμάτωση με τις εφαρμογές και το οικοσύστημα της Google και η έμφαση στη γνώση και την επικαιρότητα.

Το Gemini (ιδιαίτερα οι τελευταίες προηγμένες εκδόσεις του) δεν εκπαιδεύτηκε μόνο σε κείμενο, αλλά από την αρχή σε κείμενο, εικόνα και ήχο ταυτόχρονα. Αυτό του επιτρέπει να «σκέφτεται» και να επεξεργάζεται πληροφορίες με πιο ολοκληρωμένο τρόπο. Για παράδειγμα, μπορείτε να του δείξετε μια φωτογραφία με μια εξίσωση ή ένα γράφημα και να το ρωτήσετε «να σας εξηγήσει τι βλέπει», συνδυάζοντας οπτική και γλωσσική ανάλυση.

Ένα τεράστιο πλεονέκτημα του Gemini είναι η φυσική του ενσωμάτωση με το ευρύτερο οικοσύστημα της Google (Search, Gmail, Docs, Workspace), κάνοντάς το ένα εξαιρετικό εργαλείο παραγωγικότητας για όσους χρησιμοποιούν τα εργαλεία και τις εφαρμογές της Google (Google Apps).

Λόγω της έμφασης του Gemini στη γνώση και την επικαιρότητα, η Google έχει αποκτήσει ένα τεράστιο συγκριτικό πλεονέκτημα στην αναζήτηση, διαχείριση και οργάνωση της πληροφορίας με τη χρήση της Τεχνητής Νοημοσύνης.

Μεταφορικά: αν το ChatGPT είναι μια πορτοκαλιά σε μια αυλή, το Gemini είναι μια πορτοκαλιά μέσα σ’ ένα οργανωμένο αγρόκτημα, με άρδευση, αποθήκες, μηχανές συσκευασίας για τα πορτοκάλια και δίκτυο διανομής.

Microsoft Copilot: Το ChatGPT… με γραβάτα γραφείου

Η Microsoft επίσης δεν θα μπορούσε να μείνει εκτός παιχνιδιού. Με το μοντέλο της Copilot, που βασίζεται σε τεχνολογία OpenAI, έχει μπει δυναμικά στον χώρο της Τεχνητής Νοημοσύνης με φιλοσοφία που είναι σαφώς πιο εργασιακή.

Πρακτικά, κάνει ότι σχεδόν το ChatGPT, αλλά είναι απόλυτα συνδεδεμένο με τις εφαρμογές Office και ιδιαίτερα με τα: Word, Excel, Outlook καθώς και το Teams. Η μοναδικότητά του έγκειται στην αξεπέραστη δυνατότητά του να αυτοματοποιεί εργασίες στο περιβάλλον εργασίας, όπως η σύνταξη email, η περίληψη συναντήσεων στο Teams ή η ανάλυση δεδομένων στο Excel, αυξάνοντας καθοριστικά την παραγωγικότητα.

Μεταφορικά: Είναι η ίδια πορτοκαλιά με το ChatGPT, φυτεμένη μέσα σε εταιρικό θερμοκήπιο

Anthropic Claude: Η δύναμη της Ασφάλειας και της Ηθικής

Η Anthropic είναι μια εταιρεία που ιδρύθηκε από πρώην στελέχη της OpenAI και προσφέρει τη σειρά μοντέλων Τεχνητής Νοημοσύνης Claude. Η βασική τους φιλοσοφία διαφέρει ριζικά από το ChatGPT και το Gemini, καθώς έχει δώσει έμφαση στην ασφάλεια (Safety) και στην ηθική της Τεχνητής Νοημοσύνης.

Το πλεονέκτημα της «Ασφάλειας» έχει προσδοθεί στο Claude από τη διαδικασία με την οποία εκπαιδεύτηκε, που ονομάζεται «Συνταγματική Τεχνητή Νοημοσύνη (Constitutional AI)»: Με βάση την εκπαίδευσή του, το μοντέλο αυτό καθοδηγείται από ένα σύνολο αρχών (που αποτελούν το «Σύνταγμα – Constitution»), το οποίο το καθιστούν εξαιρετικά ανθεκτικό στο να αποφεύγει να παράγει επιβλαβές, ανακριβές ή μη ηθικό περιεχόμενο.

Το Claude είναι επίσης γνωστό για την ικανότητά του να διαχειρίζεται εξαιρετικά μεγάλα «context windows» (το παράθυρο πληροφοριών που μπορεί να θυμάται/επεξεργαστεί ταυτόχρονα). Αυτό το καθιστά ιδανικό για την ανάλυση εκτενών εγγράφων, βιβλίων ή νομικών κειμένων.

Μεταφορικά: το Claude είναι η «βιολογική πορτοκαλιά» που δεν δίνει τα πιο φανταχτερά πορτοκάλια, αλλά ξέρεις ότι είναι ελεγμένα, καθαρά και ασφαλή για κατανάλωση.

Grok: Το πιο «χαλαρό» μη τυπικό με περισσότερη αμεσότητα GPT

Το Grok είναι η εφαρμογή Τεχνητής Νοημοσύνης της εταιρείας xAI του Έλον Μασκ, που ξεχωρίζει για την άμεση πρόσβαση σε real-time δεδομένα από την πλατφόρμα X (πρώην Twitter). Αυτό του δίνει ένα προβάδισμα σε θέματα επικαιρότητας και τάσεων. Η φιλοσοφία του είναι να παρέχει απαντήσεις με μια δόση χιούμορ και σαρκασμού, προσφέροντας μια λιγότερο «εταιρική» και πιο «αντισυμβατική» εμπειρία συνομιλίας.

Παρέχει «Προσωπικότητες» που καθορίζουν τον τόνο των απαντήσεων: επιτρέπει πιο «persona-driven» χρήση (π.χ. storyteller, πιο «unhinged» mode), που το κάνει πιο «ζωντανό» στη συζήτηση, αλλά όχι πάντα ιδανικό για αυστηρά εταιρικό ύφος. Είναι ιδανικό για σύντομους σχολιασμούς, ιδέες, γρήγορη σύνθεση και αποκάλυψη μυστικών για το «τι παίζεται γύρω από ένα θέμα».

Μεταφορά: Ολόφρεσκα πορτοκάλια ημέρας όχι τέλεια, που δεν ξέρουμε από ποια πορτοκαλιά ήρθαν.

Mistral: Η ευρωπαϊκή πορτοκαλιά

Η εφαρμογή Mistral AI εκπροσωπεί την ευρωπαϊκή προσέγγιση στην Τεχνητή Νοημοσύνη. Παρουσιάζει εξαιρετικά πλεονεκτήματα, όπως τα ανοιχτά και αποδοτικά μοντέλα που ενδιαφέρουν περισσότερο τους τεχνικούς, οι οποίοι θέλουν «πλατφόρμες εργασίας» και όχι απλώς «ένα chat». Είναι ιδανική λύση για on-premise και enterprise λύσεις και γι’ αυτό κάνει πολλές συνεργασίες με ευρωπαϊκές κυβερνήσεις (μεταξύ των οποίων και η ελληνική). Επίσης, την προτιμούν πολλές ευρωπαϊκές εταιρίες λογισμικού (μεταξύ των οποίων και η Γερμανική SAP).

Ως ευρωπαϊκή εταιρεία έχει δώσει προφανώς έμφαση στην ιδιωτικότητα και την κανονιστική συμμόρφωση (GDPR).

Μεταφορά: Μια πορτοκαλιά καλλιεργημένη με ευρωπαϊκούς κανόνες ποιότητας και ελέγχου.

DeepSeek: Η Κινέζικη πορτοκαλιά

Το DeepSeek είναι ένα μοντέλο που αναπτύχθηκε από μια κινεζική startup. Έχει αναδειχθεί ως ένας εξαιρετικά ικανός παίκτης, ειδικά σε τεχνικές εργασίες. Διακρίνεται για την προηγμένη ικανότητά του στην παραγωγή κώδικα (code generation) και τη συστηματική του προσέγγιση σε σύνθετα μαθηματικά ή λογικά προβλήματα (Chain-of-Thought reasoning).

Η τεχνολογική του καινοτομία έγκειται στην αρχιτεκτονική Mixture-of-Experts (MoE), που είναι παρόμοια με του Mistral, η οποία επιτρέπει στο μοντέλο να έχει έναν τεράστιο συνολικό αριθμό παραμέτρων, αλλά να ενεργοποιεί μόνο ένα μικρό υποσύνολο από αυτές για κάθε ερώτηση. Αυτό μεταφράζεται σε υψηλή απόδοση με σημαντικά χαμηλότερο κόστος εκπαίδευσης και λειτουργίας σε σχέση με τους παραδοσιακούς κολοσσούς. Είναι μια εξαιρετική επιλογή για εταιρείες που αναζητούν ισχυρά, εξειδικευμένα μοντέλα σε προσιτή τιμή.

Μεταφορά: Πορτοκαλιά υψηλής απόδοσης με χαμηλό κόστος καλλιέργειας

Meta Llama: Η δύναμη του Open Source

Η Meta (Facebook) έφερε επανάσταση, όχι απαραίτητα μ’ ένα μοντέλο που ανταγωνίζεται άμεσα την ταχύτητα, την ποιότητα ή την ισχύ του ChatGPT, αλλά με τον τρόπο που διέθεσε το μοντέλο Llama στην κοινότητα. Το πιο σημαντικό της πλεονέκτημα είναι ο ανοιχτός κώδικας (Open Source): Το Llama, και οι παραλλαγές του, είναι διαθέσιμα στην ερευνητική και εμπορική κοινότητα με σχετικά ανοιχτές άδειες. Αυτή η κίνηση ήταν καταλυτική, καθώς επέτρεψε σε χιλιάδες μικρότερες εταιρείες, developers και ερευνητές να το προσαρμόσουν, να το «ρυθμίσουν» (fine-tune) και να δημιουργήσουν εξειδικευμένες εφαρμογές πάνω σε αυτό.

Η ύπαρξη του Llama έδωσε ώθηση στη δημιουργία χιλιάδων εξειδικευμένων μοντέλων (π.χ. ιατρικά LLMs, χρηματοοικονομικά LLMs), αποδεικνύοντας ότι το καλύτερο «πορτοκάλι» μπορεί να είναι ένα ειδικά διαμορφωμένο, τοπικό προϊόν.

Μεταφορά: Σπόροι πορτοκαλιάς (όχι έτοιμα πορτοκάλια). Αν όμως τους καλλιεργήσεις σωστά, κάνεις δικό σου πορτοκαλεώνα.

Συμπέρασμα: Ο Πλούτος του Πορτοκαλεώνα

Ο υγιής ανταγωνισμός στον κόσμο της Τεχνητής Νοημοσύνης είναι το μεγαλύτερο όφελος για την ανθρωπότητα. Για τον τελικό χρήστη, αυτό σημαίνει ότι δεν πρέπει να περιορίζεται σε μία μόνο λύση. Οφείλουμε να βάζουμε το ίδιο ερώτημα σε περισσότερες από μία εφαρμογές (όπως στους 7 σοφούς της Αρχαίας Ελλάδας).

Τελικά η εποχή της μονοκρατορίας του ChatGPT στην Τεχνητή Νοημοσύνη έχει τελειώσει. Το κλειδί είναι να αποκτήσετε τη συνήθεια και τη γνώση να επιλέγετε το καλύτερο εργαλείο για την εκάστοτε δουλειά: Αν χρειάζεστε ανάλυση ενός τεράστιου PDF, ίσως το Claude είναι η καλύτερη επιλογή. Αν θέλετε να οργανώσετε το email σας και να κάνετε μια σύνθετη αναζήτηση στο Google ταυτόχρονα, το Gemini είναι το κατάλληλο εργαλείο. Εάν είστε developer και θέλετε να φτιάξετε ένα ιδιωτικό, προσαρμοσμένο chatbot για την εταιρεία σας, το Llama προσφέρει την καλύτερη βάση.