Goldman Sachs: Η επόμενη επανάσταση στην Τεχνητή Νοημοσύνη, τι είναι τα world models

Η νέα γενιά στην τεχνητή νοημοσύνη ως «λειτουργικό σύστημα» λήψης αποφάσεων. Πώς σπάει τα παλιά όρια, σύμφωνα με ανάλυση της Goldman Sachs

Τεχνητή νοημοσύνη © Freepik

Η τεχνητή νοημοσύνη εισέρχεται σε μια νέα εποχή, όπου τα συστήματα δεν περιορίζονται πλέον στην αναγνώριση προτύπων και στην παραγωγή κειμένου. Τα λεγόμενα «world models» επιχειρούν να διδάξουν στις μηχανές πώς λειτουργεί ο πραγματικός κόσμος, αλλάζοντας ριζικά τη λήψη αποφάσεων.

Όπως αναφέρει ανάλυση της Golman Sachs, μετά από μια δεκαετία κυριαρχίας των μεγάλων γλωσσικών μοντέλων (LLMs), η τεχνητή νοημοσύνη εισέρχεται σε μια νέα φάση εξέλιξης. Μέχρι σήμερα, η πρόοδος της AI βασίστηκε κυρίως σε συστήματα που αναγνωρίζουν μοτίβα και προβλέπουν το επόμενο στοιχείο σε μια ακολουθία — κυρίως το επόμενο κείμενο ή λέξη.

Από αυτή τη σχετικά απλή αρχή γεννήθηκαν εντυπωσιακές δυνατότητες: μετάφραση, συγγραφή, δημιουργία κώδικα και συνομιλία με πρωτοφανή φυσικότητα. Ωστόσο, η ίδια αυτή επιτυχία αποκάλυψε και το βασικό όριο της σημερινής τεχνητής νοημοσύνης.

Τα LLMs είναι εξαιρετικά στην ολοκλήρωση μοτίβων, αλλά δεν διαθέτουν πραγματική εσωτερική κατανόηση του κόσμου που περιγράφουν. Μπορούν να απαντούν πειστικά σε ερωτήματα, αλλά δυσκολεύονται όταν πρέπει να προβλέψουν συνέπειες ή να λειτουργήσουν σε περιβάλλοντα όπου τα λάθη έχουν πραγματικό κόστος.

Η τεχνητή νοημοσύνη αλλάζει παράδειγμα

Το πρόβλημα γίνεται ιδιαίτερα εμφανές όταν η AI καλείται να διαχειριστεί ρομπότ, αλυσίδες εφοδιασμού ή πολύπλοκες επιχειρηματικές διαδικασίες. Εκεί, η απλή πρόβλεψη δεν αρκεί. Η νοημοσύνη απαιτεί κατανόηση αιτίου και αποτελέσματος.

Η νέα γενιά συστημάτων AI βασίζεται στα λεγόμενα «world models» — εσωτερικά μοντέλα προσομοίωσης της πραγματικότητας. Αντί η μηχανή να απαντά απλώς σε ένα ερέθισμα, δημιουργεί μια εσωτερική αναπαράσταση του κόσμου και «δοκιμάζει» εικονικά τι θα συμβεί αν προχωρήσει σε μια συγκεκριμένη ενέργεια.

Με άλλα λόγια, η τεχνητή νοημοσύνη αρχίζει να πραγματοποιεί κάτι αντίστοιχο με «νοητικά πειράματα». Εξετάζει πιθανότητες, υπολογίζει κινδύνους και προσομοιώνει σενάρια πριν δράσει.

Τα world models και η νέα εποχή της τεχνητής νοημοσύνης

Ο Γιαν ΛεΚουν, πρώην επικεφαλής επιστήμονας AI της Meta, θεωρεί τα world models κεντρικό στοιχείο για την επίτευξη τεχνητής γενικής νοημοσύνης. Μέσω του μοντέλου JEPA, επιχειρεί να δημιουργήσει μηχανές που μαθαίνουν πώς λειτουργεί ο κόσμος μέσω παρατήρησης, όπως περίπου κάνουν οι άνθρωποι.

Αντίστοιχα, η καθηγήτρια του Stanford Φέι-Φέι Λι, γνωστή από το πρόγραμμα ImageNet, εργάζεται πάνω στη λεγόμενη «χωρική νοημοσύνη». Η προσέγγισή της δεν περιορίζεται στην αναγνώριση αντικειμένων μέσα σε εικόνες, αλλά επεκτείνεται στην κατανόηση του πώς αυτά τα αντικείμενα κινούνται, αλληλεπιδρούν και μεταβάλλονται στον χώρο και στον χρόνο.

Φυσικός και κοινωνικός κόσμος: Οι δύο πραγματικότητες της AI

Οι ερευνητές διαχωρίζουν πλέον τα world models σε δύο βασικές κατηγορίες, σύμφωνα με την ανάλυση της Goldman Sachs.

  1. Η πρώτη κατηγορία αφορά τον φυσικό κόσμο: βαρύτητα, κίνηση, θερμότητα, τριβή και δυνάμεις. Τα μοντέλα αυτά επιτρέπουν στα ρομπότ να μαθαίνουν πώς λειτουργεί η φυσική πραγματικότητα χωρίς να χρειάζεται να αποτυγχάνουν συνεχώς στον πραγματικό κόσμο.Ένα ρομπότ μπορεί να εξασκηθεί εκατομμύρια φορές σε προσομοιώσεις πριν επιχειρήσει μια πραγματική κίνηση. Έτσι μαθαίνει να ισορροπεί, να μεταφέρει αντικείμενα ή να κινείται σε πολύπλοκα περιβάλλοντα με μικρότερο κίνδυνο.Οι εξελίξεις αυτές έχουν ήδη επιταχύνει την αυτοματοποίηση στις αποθήκες, στις μεταφορές και στα αυτόνομα οχήματα. Η ουσιαστική πρόοδος δεν προέρχεται μόνο από καλύτερο hardware, αλλά κυρίως από πιο εξελιγμένα μοντέλα κατανόησης της πραγματικότητας.
  2. Η δεύτερη κατηγορία αφορά τον κοινωνικό και οικονομικό κόσμο: Εδώ οι νόμοι της φυσικής αντικαθίστανται από ανθρώπινα κίνητρα, συμπεριφορές, κανόνες και συστήματα εξουσίας. Τα μοντέλα αυτά δημιουργούν ψηφιακά περιβάλλοντα γεμάτα από AI agents — ψηφιακούς «παίκτες» με στόχους, μνήμη και δυνατότητα λήψης αποφάσεων. Οι agents αλληλεπιδρούν μεταξύ τους και μέσα από αυτές τις αλληλεπιδράσεις προκύπτουν δυναμικά μοτίβα συμπεριφοράς.

Η τεχνητή νοημοσύνη ως «λειτουργικό σύστημα» λήψης αποφάσεων

Οι εφαρμογές αυτών των μοντέλων αποκτούν ήδη στρατηγική σημασία για επιχειρήσεις και κυβερνήσεις.

Οι προσομοιώσεις πολυπρακτορικών συστημάτων (multi-agent simulations) χρησιμοποιούνται πλέον για stress tests σε οικονομικές στρατηγικές, κρίσεις εφοδιαστικής αλυσίδας, γεωπολιτικά σοκ και στρατιωτικά σενάρια.

Στην ουσία, οι οργανισμοί αποκτούν τη δυνατότητα να «δοκιμάζουν» αποφάσεις πριν τις εφαρμόσουν στην πραγματικότητα.

Η λογική θυμίζει τα στρατιωτικά war games, όπου διαφορετικά σενάρια συγκρούσεων εξετάζονται μέσω προσομοιώσεων. Πλέον, όμως, η ίδια προσέγγιση μεταφέρεται στις αγορές, στις επιχειρήσεις και στη δημόσια διοίκηση.

Αντί η AI να προσφέρει μία μόνο πρόβλεψη, τα world models αναδεικνύουν εύρη πιθανών εξελίξεων, αλυσιδωτές αντιδράσεις και κρυφές δυναμικές ενός συστήματος.

Η διαφορά μεταξύ πρόβλεψης και προσομοίωσης είναι κρίσιμη: η πρόβλεψη επιχειρεί να βρει ένα αποτέλεσμα, ενώ η προσομοίωση εξετάζει πώς συμπεριφέρεται ένα σύστημα υπό πίεση.

Από την αναγνώριση προτύπων στην κατανόηση συστημάτων

Οι αναλυτές εκτιμούν ότι η μετάβαση αυτή μπορεί να αλλάξει συνολικά την οικονομία της τεχνητής νοημοσύνης.

Μέχρι σήμερα, η αγορά επικεντρωνόταν κυρίως σε μεγαλύτερα μοντέλα, περισσότερα δεδομένα και αυξημένη υπολογιστική ισχύ. Τα world models μεταφέρουν το ενδιαφέρον στην ποιότητα της προσομοίωσης και στην κατανόηση σύνθετων συστημάτων.

Οι ανάγκες σε υπολογιστική ισχύ ενδέχεται να αυξηθούν δραματικά, καθώς οι προσομοιώσεις φυσικών και κοινωνικών κόσμων απαιτούν τεράστιους όγκους δεδομένων, συνθετικά περιβάλλοντα και πολύπλοκες μηχανές φυσικής.

Παρότι τα συστήματα αυτά είναι εξαιρετικά ακριβά, οι υποστηρικτές τους θεωρούν ότι η αξία τους υπερβαίνει κατά πολύ το κόστος. Σε τομείς όπου τα λάθη είναι δαπανηρά — από τη γεωπολιτική έως τη βιομηχανία — η δυνατότητα πρόβλεψης συνεπειών μπορεί να δημιουργήσει τεράστιο ανταγωνιστικό πλεονέκτημα.

Η επόμενη φάση με πολλαπλές μορφές τεχνητής νοημοσύνης

Οι ειδικοί εκτιμούν ότι το μέλλον της AI δεν θα βασίζεται αποκλειστικά στα γλωσσικά μοντέλα ούτε αποκλειστικά στα world models, αλλά στον συνδυασμό τους.

Τα LLMs θα λειτουργούν ως διεπαφή επικοινωνίας και κατανόησης γλώσσας, ενώ τα world models θα αναλαμβάνουν σχεδιασμό, στρατηγική και κατανόηση συνεπειών.

Όπως ο ανθρώπινος εγκέφαλος συνδυάζει διαφορετικές περιοχές — όραση, γλώσσα, κίνηση και σχεδιασμό — έτσι και τα μελλοντικά συστήματα AI πιθανότατα θα ενοποιούν πολλαπλές μορφές νοημοσύνης.

Η μετάβαση αυτή σηματοδοτεί κάτι βαθύτερο από μια τεχνολογική αναβάθμιση, σημειώνουν οι αναλυτες της Goldman Sachs. Δείχνει μια αλλαγή στον ίδιο τον ορισμό της τεχνητής νοημοσύνης.

Η AI παύει να είναι απλώς μηχανή παραγωγής απαντήσεων και εξελίσσεται σε σύστημα κατανόησης της πραγματικότητας, των περιορισμών και των συνεπειών.

Και αυτή ακριβώς η μετάβαση ενδέχεται να καθορίσει την επόμενη μεγάλη οικονομική και γεωπολιτική ανατροπή της ψηφιακής εποχής.