Μπορεί η Κίνα να σπάσει τη “φούσκα” της τεχνητής νοημοσύνης των ΗΠΑ;

Ένα νέο μοντέλο επιβάλλει επανεκτίμηση της κατάστασης

Τεχνητή νοημοσύνη ©Pixbay

Το προβάδισμα των ΗΠΑ έναντι της Κίνας στη τεχνητή νοημοσύνη ενδέχεται να βρίσκεται στο χαμηλότερο επίπεδο της τελευταίας χρονιάς. Όταν η Κίνα ανέτρεψε την κούρσα του ανταγωνισμού στον τομέα τον Ιανουάριο του 2025 με την κυκλοφορία του DeepSeek R1, προκάλεσε απώλεια 1 τρισεκατομμυρίου δολαρίων από τις αμερικανικές κεφαλαιαγορές. Η Nvidia, εταιρεία κατασκευής μικροεπεξεργαστών, έχασε προσωρινά το 17% της αξίας της, ενώ ο δείκτης Nasdaq υποχώρησε κατά 3,1% μέσα σε μία μέρα. Οι Αμερικανοί επενδυτές ανησύχησαν όχι μόνο επειδή η κινεζική τεχνητή νοημοσύνη ήταν καλή, αλλά και επειδή διανεμόταν δωρεάν. Ο πανικός σύντομα υποχώρησε. Από τότε, οι αποτιμήσεις των αγορών σε όλο τον κόσμο εξαρτώνται όλο και περισσότερο από την υπόσχεση ότι η τεχνητή νοημοσύνη θα είναι τόσο επαναστατική όσο και κερδοφόρα.

Σήμερα, τα κινεζικά εργαστήρια αναστατώνουν εκ νέου τους Αμερικανούς ανταγωνιστές τους στον αγώνα για το μονοπώλιο της αγοράς μοντέλων. Στις 13 Ιουνίου, ένα εργαστήριο με έδρα το Πεκίνο, το Zhipu ή Z.ai, ανακοίνωσε το τελευταίο του σύστημα, το GLM-5.2, υποσχόμενο «ένα βήμα πιο κοντά στην πρωτοποριακή νοημοσύνη για όλους». Πρόκειται για το πιο ικανό μοντέλο που έχει εκπαιδευτεί στην Κίνα μέχρι σήμερα, το οποίο λειτουργεί με κόστος μικρότερο από το ένα δέκατο της τιμής της τελευταίας έκδοσης της Anthropic, του Fable 5. Κι όπως συμβαίνει με άλλα κινεζικά μοντέλα, οι συντελεστές βάρους, ή παράμετροι, που επιτρέπουν τη λειτουργία του GLM-5.2 έχουν δημοσιοποιηθεί. Με αυτό το νέο μοντέλο, η Κίνα ανταγωνίζεται σε επίπεδο ικανότητας, κόστους και διαφάνειας. Η προσφορά φαίνεται τόσο ελκυστική όσο και επίκαιρη.

Τις τελευταίες εβδομάδες, οι αμερικανικές εταιρείες αντιμετωπίζουν το πρόβλημα της ραγδαίας αύξησης του κόστους της τεχνητής νοημοσύνης, το οποίο σε ορισμένες περιπτώσεις φτάνει τις χιλιάδες δολάρια ανά υπάλληλο. Ορισμένες εταιρείες καθορίζουν προϋπολογισμούς για τα «tokens» (τμήματα κειμένου που επεξεργάζεται ένα μοντέλο). Στη συνέχεια, στις 12 Ιουνίου, η κυβέρνηση Trump απαγόρευσε τη χρήση του Fable 5 στους μη Αμερικανούς, με αποτέλεσμα η Anthropic να διακόψει την πρόσβαση για όλους. Για πρώτη φορά, η πρόσβαση στην πρωτοποριακή τεχνητή νοημοσύνη εξαρτάται από την έγκριση της αμερικανικής κυβέρνησης. Όλα αυτά ενδέχεται να δώσουν στους χρήστες λόγους να αναζητήσουν εναλλακτικές έναντι της αμερικανικής τεχνητής νοημοσύνης. Πολλοί θα θεωρήσουν το GLM-5.2 ικανό και προσιτό και θα εκτιμήσουν το γεγονός ότι βρίσκεται εκτός της εμβέλειας της κυβέρνησης Trump.

Ας δούμε αρχικά τις δυνατότητές του. Η Artificial Analysis, μια εταιρεία έρευνας, αξιολογεί το GLM-5.2 ως το πιο έξυπνο μοντέλο ανοιχτού κώδικα στην αγορά. Το GLM-5.2 καταλαμβάνει την εντυπωσιακή τέταρτη θέση στη συνολική λίστα της, πίσω από το ChatGPT 5.5 της OpenAI και μπροστά από το bot Gemini της Google. Το μοντέλο εκπλήσσει τους πάντες. Νωρίτερα φέτος, οι Κινέζοι προγραμματιστές ήταν απαισιόδοξοι όσον αφορά την προοπτική τα μοντέλα τους να ξεπεράσουν τα αμερικανικά πριν από το 2030. Μετά την κυκλοφορία του Zhipu, ο Elon Musk έγραψε στο X, τον ιστότοπο κοινωνικής δικτύωσης που διατηρεί, ότι αναμένει μέχρι τις αρχές του επόμενου έτους η Κίνα να φτάσει στο επίπεδο των σημερινών κορυφαίων μοντέλων. «Δεν θα πάρει τόσο πολύ», απάντησε αμέσως ο Tang Jie, συνιδρυτής του Zhipu.

Σε αντίθεση με την περίπτωση του DeepSeek, οι αμερικανικές αγορές έχουν δείξει μέχρι στιγμής ελάχιστο ενδιαφέρον για το GLM-5.2, το οποίο, εν μέρει, οφείλεται στο γεγονός ότι έχει γίνει πιο δύσκολο να εκτιμηθεί με ακρίβεια η ικανότητα των κινεζικών μοντέλων. Για να καταλήξει στις εκτιμήσεις της, η Artificial Analysis αξιολόγησε το GLM-5.2 σε δεκάδες δοκιμές αναφοράς, οι οποίες χρησιμοποιούν ερωτήσεις τύπου εξετάσεων για να αξιολογήσουν την ευφυΐα ενός μοντέλου. Η Αμερική, μέσω της Anthropic, διατηρεί το πλεονέκτημά της σε ό,τι αφορά την απόδοση. Το Fable 5, με βάση τον μέσο όρο των δοκιμαστικών εργασιών, είναι περίπου 17% εξυπνότερο από το GLM-5.2. Ο άλλος σημαντικός δείκτης είναι ο χρόνος που χρειάστηκε το GLM-5.2 για να φτάσει σε αυτό το επίπεδο νοημοσύνης. Ένα δυτικό μοντέλο συγκρίσιμο με το GLM-5.2 κυκλοφόρησε τον Φεβρουάριο, δηλαδή πριν από περίπου τέσσερις μήνες.

Στην πραγματικότητα, το προβάδισμα των ΗΠΑ είναι πιθανώς μεγαλύτερο από τέσσερις μήνες. Τα μοντέλα ανοιχτού κώδικα, πολλά από τα οποία είναι κινεζικά, τείνουν να αποδίδουν καλύτερα σε δημόσιες δοκιμές αναφοράς σε σύγκριση με τα ιδιωτικά, λέει ο Havard Tveit Ihle του Νορβηγικού Ιδρύματος Αμυντικής Έρευνας, ενός ενός κέντρου μελετών στη Νορβηγία. Οι ερωτήσεις που χρησιμοποιούνται στις δημόσιες δοκιμές αναφοράς δημοσιεύονται, ενώ όσοι εφαρμόζουν ιδιωτικές δοκιμές αναφοράς διατηρούν τις αξιολογήσεις τους μυστικές. Ανάλυση του Δρ. Tveit Ihle που δημοσιεύθηκε πριν από την κυκλοφορία του GLM-5.2 διαπίστωσε ότι, στις δημόσιες δοκιμές, τα κινεζικά μοντέλα μηχανικής μάθησης υστερούσαν κατά περίπου τέσσερις έως έξι μήνες σε σχέση με τα αμερικανικά. Ωστόσο, στις ιδιωτικές δοκιμές, το προβάδισμα των ΗΠΑ σχεδόν διπλασιάστηκε, φτάνοντας τους οκτώ έως δέκα μήνες (βλ. διάγραμμα). Μια μελέτη της αμερικανικής κυβέρνησης, που δημοσιεύθηκε τον Μάιο, εντόπισε ένα παρόμοιο χάσμα. Ο κ. Tveit Ihle αναφέρει ότι τα κινεζικά εργαστήρια φαίνεται, πιθανώς χωρίς να το συνειδητοποιούν, να «προετοιμάζουν τα μοντέλα ειδικά για τις δοκιμές».

Σε δύο ιδιωτικά τεστ αναφοράς που έχουν δοκιμαστεί μέχρι στιγμής, το GLM-5.2 παρουσιάζει τα ίδια χαρακτηριστικά: υστερεί κατά περίπου επτά μήνες στο Weirdml, ένα μέτρο ασυνήθιστων εργασιών μηχανικής μάθησης που απαιτούν προσεκτική συλλογιστική για την επίλυσή τους, και κατά ένα ολόκληρο έτος στο SimpleBench, το οποίο αξιολογεί την κοινή λογική προσπαθώντας να ξεγελάσει τα μοντέλα. Ωστόσο, το μοτίβο αυτό δεν είναι σταθερό. Μια νέα δοκιμασία που δημοσιεύθηκε από την Artificial Analysis στις 19 Ιουνίου αξιολογεί μοντέλα σε εργασίες γραφείου, όπως το διαχωρισμό ακατάστατων αρχείων και την αξιολόγηση αντικρουόμενων πληροφοριών. Το GLM-5.2 δεν θα μπορούσε να έχει εκπαιδευτεί γι’ αυτή την αξιολόγηση. Ωστόσο, ξεπέρασε σε απόδοση το ChatGPT 5.5, το οποίο κυκλοφόρησε μόλις πριν από δύο μήνες. Αυτά τα αποτελέσματα υποδηλώνουν ότι το προβάδισμα των ΗΠΑ παραμένει σταθερό, λέει ο κ. Tveit Ihle, αλλά αποτελούν επίσης απόδειξη ότι το χάσμα δεν διευρύνεται όπως κάποιοι είχαν προβλέψει.

Αυτό που προκαλεί ιδιαίτερη έκπληξη σχετικά με το GLM-5.2 είναι ότι επιτυγχάνει σε εργασίες που συνήθως αποτελούν εμπόδιο για τα ομόλογά του. Τα κινεζικά μοντέλα συχνά υπερέχουν σε τομείς με σαφείς σωστές ή λάθος απαντήσεις, όπως τα μαθηματικά και η γλώσσα προγραμματισμού. Ωστόσο, τείνουν να αποτυγχάνουν σε προβλήματα ανοιχτού τύπου ή εκείνα που απαιτούν διαρκή ανεξάρτητη κρίση. Αυτό το μοτίβο αντικατοπτρίζει μία από τις μεγαλύτερες προκλήσεις που αντιμετωπίζουν οι ερευνητές στην Κίνα. Οι έλεγχοι στις εξαγωγές προηγμένων τσιπ έχουν στερήσει τα κινεζικά εργαστήρια από την υπολογιστική ισχύ που απαιτείται για την εκπαίδευση των ισχυρότερων μοντέλων. Έτσι, τείνουν να ανακτούν έδαφος στη φάση μετά την εκπαίδευση: βαθμονομώντας με ακρίβεια τα μοντέλα ώστε να συμπεριφέρονται με συγκεκριμένους τρόπους ή να επιλύουν συγκεκριμένα είδη προβλημάτων, μεταξύ άλλων και σε δεδομένα που φέρεται να έχουν συλλεχθεί από αμερικανικά συστήματα μέσω μιας διαδικασίας που ονομάζεται «απόσταξη» (distillation).

Δεδομένων των αβεβαιοτήτων που περιβάλλουν τις πραγματικές δυνατότητες των κινεζικών μοντέλων, ας εξετάσουμε στη συνέχεια αν είναι πραγματικά φθηνότερα από τα αντίστοιχα αμερικανικά. Η DeepSeek χρεώνει μόλις 0,87 δολάρια ανά 1 εκατομμύριο token εξόδου για το μοντέλο της v4, ενώ η Anthropic χρεώνει 50 δολάρια για το ίδιο στο Fable 5. Τέτοιες τιμές ενδέχεται να έχουν αυξανόμενη ελκυστικότητα στην Αμερική, όπου το κόστος των token σε ορισμένες εταιρείες έχει ξεφύγει από τον έλεγχο. Σύμφωνα με την εταιρεία έκδοσης τιμολογίων Ramp, τον Ιούνιο, η DeepSeek σημείωσε απότομη αύξηση στις αμερικανικές εταιρείες που πληρώνουν για τις υπηρεσίες της. Σύμφωνα με πληροφορίες, η Microsoft εξετάζει το ενδεχόμενο να χρησιμοποιήσει το μοντέλο του κινεζικού εργαστηρίου στο κορυφαίο chatbot της, το Copilot. Ωστόσο, αυτή η σημαντικότατη υπόθεση, ότι δηλαδή η κινεζική τεχνητή νοημοσύνη είναι φθηνότερη, μπορεί συχνά να είναι λανθασμένη.

Αν και τα κινεζικά μοντέλα γίνονται όλο και ικανότερα, γενικά δεν γίνονται πιο αποδοτικά. Τα κινεζικά μοντέλα χρησιμοποιούν πολύ περισσότερα tokens για να επεξεργαστούν τις απαντήσεις τους. Μια μελέτη που επικαιροποιήθηκε αυτό το μήνα από τον Du Zheng του Georgia Tech και τους συν-συγγραφείς του δείχνει ότι, για τις ίδιες εργασίες, ένα μοντέλο DeepSeek χρησιμοποίησε 23 φορές περισσότερα tokens από τον ανταγωνιστή του της OpenAI για να επιτύχει ουσιαστικά το ίδιο αποτέλεσμα. Λόγω αυτών των μεγάλων διαφορών στην αποδοτικότητα, ο σωστός τρόπος σύγκρισης των μοντέλων δεν είναι η τιμή ανά token, αλλά το συνολικό κόστος όλων των token που χρησιμοποιήθηκαν. Χρησιμοποιώντας αυτόν τον δείκτη, σε ένα τεστ αναφοράς σχεδιασμένο για τη δοκιμή της μηχανικής λογισμικού, το GLM-5.2 κατέληξε να κοστίζει περισσότερο από τα ανταγωνιστικά συστήματα της Anthropic και της OpenAI.

Εκτός από τις δυνατότητες και το κόστος, ένα τρίτο πλεονέκτημα βρίσκεται πλέον στην κορυφή των προτεραιοτήτων των χρηστών τεχνητής νοημοσύνης: η αξιοπιστία. Η Zhipu κυκλοφόρησε το μοντέλο της στις 5:21 μ.μ. ώρα Πεκίνου στις 13 Ιουνίου, ακριβώς 24 ώρες αφότου η κυβέρνηση Trump ενημέρωσε την Anthropic ότι απαγόρευε σε μη Αμερικανούς τη χρήση του Fable 5. «Η στάση μας είναι ριζοσπαστικά ανοιχτή», δήλωσε ο κ. Tang. Επίσης, επέκρινε σφοδρά τους «εξωτερικούς αποκλεισμούς», όπως αυτόν που επέβαλαν η Anthropic και η αμερικανική κυβέρνηση, λέγοντας ότι καθιστούν τα συστήματα τεχνητής νοημοσύνης «αντικείμενα ανάκλησης ανά πάσα στιγμή».

Τα περισσότερα κινεζικά μοντέλα κυκλοφορούν ως ανοιχτού κώδικα, πράγμα που σημαίνει ότι ο οποιοσδήποτε μπορεί να τα κατεβάσει και να τα τρέξει σε τοπικό υλικό, εκτός της εμβέλειας των κυβερνήσεων ή των ίδιων των εργαστηρίων. Η αμερικανική κυβέρνηση θα μπορούσε κάποια μέρα να επιβάλει περιορισμούς στην εγχώρια χρήση της κινεζικής τεχνητής νοημοσύνης. Δύο επιτροπές του Κογκρέσου διερευνούν επί του παρόντος αμερικανικές εταιρείες τεχνολογίας για τη χρήση κινεζικών μοντέλων. Τα εργαστήρια της Κίνας αντιμετωπίζουν κι άλλους περιορισμούς όσον αφορά την αξιοπιστία τους: η έλλειψη υπολογιστικής ισχύος σημαίνει ότι συχνά αντιμετωπίζουν διακοπές λειτουργίας ή επιβράδυνση σε περιόδους υψηλής επισκεψιμότητας.

Ωστόσο, καθώς η κούρσα της τεχνητής νοημοσύνης αναπτύσει ταχύτητα, οι ρυθμιστικές αρχές ανά τον κόσμο θα κληθούν να αντιμετωπίσουν νέες και πιεστικές προκλήσεις σε ό,τι αφορά την ασφάλεια και την προστασία. Ο κίνδυνος μιας απότομης κυβερνητικής παρέμβασης φαίνεται να διογκώνεται και στις δύο όχθες του Ειρηνικού. Το Fable 5 αποδείχθηκε αρκετά ισχυρό ώστε να προκαλέσει μια τέτοια αντίδραση από τον Λευκό Οίκο. Το γεγονός ότι τα κινεζικά μοντέλα δεν αντιμετωπίζουν, προς το παρόν, ανάλογο ρυθμιστικό κίνδυνο, αποτελεί ενδεικτικό σημάδι: η κινεζική κυβέρνηση δεν έχει ακόμη ανησυχήσει σε βαθμό που να την οδηγήσει σε δράση. Κι αυτό, ίσως, είναι μια από τις πιο ξεκάθαρες αποδείξεις ότι παραμένουν πίσω από τους αντιπάλους τους.

© 2026 The Economist Newspaper Limited. All rights reserved. Άρθρο από τον Economist, το οποίο μεταφράστηκε και δημοσιεύθηκε με επίσημη άδεια από το www.powergame.gr. Το πρωτότυπο άρθρο, στα αγγλικά, βρίσκεται στο www.economist.com