Πόσο σύντομα θα ξεφύγει η τεχνητή νοημοσύνη από τον ανθρώπινο έλεγχο;

Η «αναδρομική αυτοβελτίωση» είναι ταυτόχρονα δελεαστική και ανησυχητική

Τεχνητή Νοημοσύνη © Unsplash

Όταν η Anthropic, κάνει το ντεμπούτο της στα χρηματιστήρια αργότερα φέτος, το πιθανότερο είναι να πυροδοτήσει μία από τις μεγαλύτερες αρχικές δημόσιες προσφορές στην ιστορία, η οποία θα οφείλεται στο γεγονός ότι το chatbot Claude της εταιρείας είναι αγαπητό στους προγραμματιστές, οι οποίοι είναι πρόθυμοι να πληρώσουν πολλά για να έχουν πρόσβαση. Από την κυκλοφορία του, τον Φεβρουάριο του 2025, ο Claude Code, ο αυτόνομος πράκτορας μηχανικής λογισμικού, έχει καταστεί απαραίτητος για πολλούς προγραμματιστές σε όλο τον κόσμο, συμπεριλαμβανομένων και των ίδιων των προγραμματιστών της Anthropic. Σύμφωνα με την εταιρεία, πάνω από τα τέσσερα πέμπτα του κώδικα που δημοσίευσε τον Μάιο γράφτηκαν από τον Claude. Πριν από την κυκλοφορία του Claude Code, το ποσοστό αυτό ήταν «χαμηλό μονοψήφιο».

Τα συστήματα έχουν βελτιωθεί τόσο σε ποιότητα όσο και σε ποσότητα. Μια σημαντική αξιολόγηση από το κέντρο μελετών METR δείχνει ότι στις αρχές του 2025 τα μοντέλα της Anthropic μπορούσαν να ολοκληρώσουν εργασίες που απαιτούσαν από τους μηχανικούς λίγο λιγότερο από μία ώρα. Τα πιο πρόσφατα συστήματα της εταιρείας μπορούν να ολοκληρώσουν εργασίες που θα απαιτούσαν περισσότερο από μία εργάσιμη ημέρα.

Μπορεί να είναι εύκολο να σηκώσει κανείς κυνικά τα φρύδια όταν η εταιρεία, στην κορυφή της λίστας της και ξεπερνώντας τον ανταγωνισμό, καλεί τον κόσμο να έχει «την επιλογή να επιβραδύνει ή να διακόψει προσωρινά την ανάπτυξη της τεχνητής νοημοσύνης αιχμής», όπως έκανε στις 5 Ιουνίου. Ποιος ηγέτης της αγοράς δεν θα επιθυμούσε ο ανταγωνισμός του να σταματήσει να προσπαθεί να τον προφτάσει;

Ωστόσο, οι ηγέτες της Anthropic, οι οποίοι εδώ και χρόνια ανησυχούν για την προοπτική μιας εκτός ελέγχου  τεχνητής νοημοσύνης που θα προκαλέσει καταστροφή, φαίνονται ειλικρινείς. Η τελευταία γενιά μοντέλων τεχνητής νοημοσύνης είναι τόσο ικανοί προγραμματιστές, μηχανικοί και (σύντομα) επιστήμονες, που πολλοί ανησυχούν ότι μπορεί να είναι από τα τελευταία που θα φτιάξουν οι άνθρωποι. Ο Jack Clark, συνιδρυτής της Anthropic, πιστεύει ότι, μέχρι το τέλος του 2028, υπάρχει 60% πιθανότητα ένα σύστημα τεχνητής νοημοσύνης να είναι ικανό να δημιουργήσει τον δικό του διάδοχο χωρίς ανθρώπινη παρέμβαση.

Αυτή η στιγμή θα σηματοδοτούσε την αρχή μιας διαδικασίας που ονομάζεται «αναδρομική αυτοβελτίωση» (RSI), και η οποία αποτελεί έναν κλειστό βρόχο. Η πρώτη έκδοση ενός μοντέλου παράγει τη δεύτερη, η οποία είναι ταχύτερη και ικανότερη, η δεύτερη παράγει την τρίτη, η οποία είναι ακόμα καλύτερη. Ο βρόχος συνεχίζεται και οι βελτιώσεις αυξάνονται με κάθε επανάληψη. Αν φτιάξετε ένα σύστημα τεχνητής νοημοσύνης ικανό για κάτι τέτοιο, οι μηχανικοί σας δεν θα χρειαστεί ποτέ να φτιάξουν άλλο. «Αυτό που μπορεί να φαίνεται σε πολλούς ως μια φανταστική ιστορία μπορεί, αντίθετα, να είναι μια πραγματική τάση», λέει ο κ. Clark.

Κανείς δεν γνωρίζει με βεβαιότητα ποιες θα ήταν οι συνέπειες της RSI. Επειδή η τεχνητή νοημοσύνη μπορεί, σε αντίθεση με τους ανθρώπους, να εργάζεται ακούραστα και συνεχώς, ορισμένοι πιστεύουν ότι θα οδηγούσε σε σύντομο χρονικό διάστημα σε μια υπερνοήμονα τεχνητή νοημοσύνη — μια «γρήγορη απογείωση». (Έχει επίσης ονομαστεί και «going foom», από τον ήχο που θα μπορούσε κανείς να φανταστεί ότι θα έκανε μια έκρηξη νοημοσύνης). Οι καταστροφολόγοι της τεχνητής νοημοσύνης φοβούνται ότι η υπερνοημοσύνη θα είναι πέρα από τον ανθρώπινο έλεγχο και ότι η έναρξη της RSI είναι η στιγμή κατά την οποία η τύχη της ανθρωπότητας παραδίδεται στις μηχανές. Ωστόσο, μια αυτοβελτιούμενη τεχνητή νοημοσύνη πιθανότατα θα αντιμετώπιζε όρια ταχύτητας, τουλάχιστον στην αρχή.

Η κατασκευή ενός μοντέλου ικανού για RSI θα απαιτούσε την αυτοματοποίηση μιας σειράς εξειδικευμένων εργασιών που εκτελούνται επί του παρόντος από ανθρώπους. Προς το παρόν, οι επιστήμονες δεδομένων εργάζονται πάνω στη θεωρία της τεχνητής νοημοσύνης και οι προγραμματιστές την εφαρμόζουν στην πράξη. Οι μηχανικοί συστημάτων χτίζουν τα θεμέλια πάνω στα οποία τα πειραματικά μοντέλα μπορούν να αναπτυχθούν σε κλίμακα παραγωγής. Άλλοι αναζητούν νέες πηγές δεδομένων εκπαίδευσης ή πειραματίζονται με τρόπους για να τα δημιουργήσουν από την αρχή. Ομάδες ευθυγράμμισης και ασφάλειας ελέγχουν ότι το αποτέλεσμα της διαδικασίας εκπαίδευσης δεν θα προκαλέσει βλάβη, σκόπιμη ή μη.

Δεν είναι όλες αυτές οι ομάδες εξίσου δεκτικές στη βοήθεια της τεχνητής νοημοσύνης, και εντός κάθε ειδικότητας ορισμένες εργασίες είναι πιο εύκολα αυτοματοποιήσιμες από άλλες. Δεν θα περάσει πολύς καιρός μέχρι ένας προγραμματιστής να μπορεί να κάνει τη δουλειά του χωρίς να γράψει ποτέ ο ίδιος ούτε μια γραμμή κώδικα, αλλά μπορεί να χρειαστεί χρόνος μέχρι μια τεχνητή νοημοσύνη να είναι σε θέση να διαπραγματευτεί την απόκτηση μιας συλλογής επιστημονικών άρθρων που δεν έχουν ψηφιοποιηθεί. Δεν είναι πάντα προφανές πώς θα εξελιχθεί το «ακανθώδες μέτωπο». Ο σχεδιασμός νέων αλγορίθμων φαινόταν μία από τις πιο ασφαλείς εργασίες, μέχρι που ένα από τα μοντέλα της Google DeepMind, το AlphaEvolve, άρχισε να το κάνει τον Μάιο του 2025. Πρότεινε μια αλλαγή στον τρόπο με τον οποίο η Google κατανέμει τα φορτία εργασίας στα κέντρα δεδομένων της, η οποία εξοικονόμησε 0,7% της παγκόσμιας υπολογιστικής ισχύος της εταιρείας, και βρήκε καλύτερους τρόπους για την εκτέλεση πολλαπλασιασμού πινάκων, κάτι που επιτάχυνε την εκπαίδευση του Gemini, του κορυφαίου μεγάλου γλωσσικού μοντέλου (LLM) της εταιρείας, κατά 1%.

Η πλήρης RSI απαιτεί την αυτοματοποίηση όλων των εργασιών σε αυτή την αλυσίδα. Ωστόσο, η επιτάχυνση της έρευνας και ανάπτυξης που βασίζεται στην τεχνητή νοημοσύνη ενδέχεται να γίνει αισθητή πριν από τότε. Σύμφωνα με έκθεση που δημοσιεύθηκε τον Ιανουάριο από το Κέντρο για την Ασφάλεια, την Τεχνητή Νοημοσύνη και τις Αναδυόμενες Τεχνολογίες (CSET), ένα κέντρο μελετών στο Πανεπιστήμιο Georgetown, «Καθώς το ποσοστό της Ε&Α στον τομέα της τεχνητής νοημοσύνης που εκτελείται από συστήματα τεχνητής νοημοσύνης αυξάνεται, η αύξηση της παραγωγικότητας σε σχέση με την Ε&Α που εκτελείται αποκλειστικά από ανθρώπους» θα μπορούσε να δεκαπλασιαστεί, στη συνέχεια να εκατονταπλασιαστεί και μετά να χιλιπλασιαστεί. Σε αυτό το σενάριο, προειδοποιεί ότι ακόμα κι αν ορισμένες πτυχές της Ε&Α στον τομέα της τεχνητής νοημοσύνης είναι αρχικά δύσκολο να αυτοματοποιηθούν, «ο επιταχυνόμενος ρυθμός προόδου σημαίνει ότι αυτά τα εμπόδια θα ξεπεραστούν σύντομα».

Σήμερα, κανένα μοντέλο τεχνητής νοημοσύνης δεν μπορεί να δημιουργήσει τον δικό του διάδοχο. Ωστόσο, τα μεγάλα μοντέλα τεχνητής νοημοσύνης μπορούν να δημιουργήσουν μικρότερα μοντέλα από μόνα τους. Με την ανθρώπινη βοήθεια, μπορούν επίσης να δημιουργήσουν και άλλα μεγάλα μοντέλα τεχνητής νοημοσύνης.

Νωρίτερα φέτος, ο Andrej Karpathy, τότε ανεξάρτητος ερευνητής και σήμερα στέλεχος της Anthropic, εκπαίδευσε ένα chatbot με δυνατότητες συγκρίσιμες με αυτές του GPT-2 — του μεγάλου γλωσσικού μοντέλου που η OpenAI είχε κυκλοφορήσει το 2019 έπειτα από 168 ώρες εκπαίδευσης σε 32 τσιπ αιχμής. Ο Δρ Karpathy πέτυχε το ίδιο αποτέλεσμα με έναν μόνο υπολογιστή οκτώ GPU σε μόλις τρεις ώρες. Με μερικούς ακόμη μήνες δουλειάς, μείωσε τον χρόνο εκπαίδευσης του μοντέλου του, Nanochat, σε λίγο πάνω από δύο ώρες.

Τον Μάρτιο, ανέθεσε την περαιτέρω βελτιστοποίηση σε έναν πράκτορα τεχνητής νοημοσύνης, τον Autoresearch. Σε δύο μόλις μέρες, ο χρόνος εκπαίδευσης έπεσε στην 1 ώρα και 48 λεπτά, ενώ πέντε μέρες αργότερα, στην 1 ώρα και 39 λεπτά. «Δεν άγγιξα τίποτα», λέει ο Δρ Karpathy. Η βελτίωση κατά 18% έναντι του ανθρώπινου αποτελέσματος εντυπωσιάζει ιδιαίτερα αν λάβει κανείς υπόψη ποιος είναι αυτός ο άνθρωπος: ιδρυτικό μέλος της ερευνητικής ομάδας της OpenAI και επικεφαλής τεχνητής νοημοσύνης της Tesla για πέντε χρόνια.

© 2026 The Economist Newspaper Limited. All rights reserved. Άρθρο από τον Economist, το οποίο μεταφράστηκε και δημοσιεύθηκε με επίσημη άδεια από το www.powergame.gr. Το πρωτότυπο άρθρο, στα αγγλικά, βρίσκεται στο www.economist.com