Οι δυστοπικές εικασίες για αυτονόμηση της Τεχνητής Νοημοσύνης φαίνεται πως τελικά δεν είναι τόσο μακριά, καθώς η Anthropic, μία από τις ισχυρότερες εταιρείες στον χώρο της ΤΝ και δημιουργός του Claude, ανοίγει ξανά τη συζήτηση για τα όρια της ανάπτυξης των προηγμένων μοντέλων AI.
Με νέα δημόσια παρέμβαση και μέσω ανάρτησης, η εταιρεία καλεί τα μεγάλα εργαστήρια τεχνητής νοημοσύνης να εξετάσουν ακόμη και το ενδεχόμενο επιβράδυνσης ή προσωρινής παύσης στην ανάπτυξη των λεγόμενων frontier AI συστημάτων, προειδοποιώντας ότι η τεχνολογία κινείται ταχύτερα απ’ όσο μπορούν να ακολουθήσουν οι κοινωνίες, οι θεσμοί και οι μηχανισμοί ελέγχου.
Στον πυρήνα της προειδοποίησης βρίσκεται η έννοια της «αναδρομικής αυτοβελτίωσης» δηλαδή το σενάριο κατά το οποίο ένα σύστημα τεχνητής νοημοσύνης θα μπορεί να σχεδιάζει, να δοκιμάζει, να βελτιώνει και τελικά να εκπαιδεύει πιο ισχυρές εκδοχές του εαυτού του, χωρίς ουσιαστική ανθρώπινη παρέμβαση. Η Anthropic διευκρινίζει ότι κάτι τέτοιο δεν έχει ακόμη συμβεί και δεν είναι βέβαιο ότι θα συμβεί. Ωστόσο, προειδοποιεί πως μπορεί να εμφανιστεί νωρίτερα απ’ όσο περιμένουν κυβερνήσεις, οργανισμοί και ερευνητικά κέντρα.
Τα ρίσκα της «αυτοβελτίωσης»
Την ανάρτηση υπογράφουν η Marina Favaro, επικεφαλής του εσωτερικού ερευνητικού ινστιτούτου της εταιρείας, και ο Jack Clark, συνιδρυτής της Anthropic. Το βασικό τους επιχείρημα είναι ότι η πρόοδος της AI δεν αλλάζει πλέον μόνο τον τρόπο με τον οποίο εργάζονται οι άνθρωποι, αλλά αρχίζει να επηρεάζει και τον τρόπο με τον οποίο κατασκευάζεται και εξελίσσεται η ίδια η τεχνητή νοημοσύνη. Τα νεότερα μοντέλα έχουν ήδη επιταχύνει σημαντικά τον προγραμματισμό λογισμικού, τη διόρθωση σφαλμάτων, την κυβερνοασφάλεια και την επιστημονική έρευνα. Αυτό μπορεί να δημιουργήσει έναν κύκλο ανατροφοδότησης που μεταφράζεται στο ότι καλύτερα μοντέλα βοηθούν στη δημιουργία ακόμη καλύτερων μοντέλων.
Η ουσία της πρόβλεψης που κάνει η Anthropic, είναι ότι μελλοντικά μπορούμε να δούμε ένα σύστημα όπως το Claude να δημιουργεί από μόνο του τον διάδοχό του. Γι’ αυτό προτείνει να υπάρξει διεθνής συμφωνία μεταξύ των κορυφαίων κέντρων AI, αλλά και μηχανισμός επαλήθευσης ότι όλοι θα τηρούν τους ίδιους κανόνες. Το ζητούμενο, όπως υποστηρίζει, είναι να δοθεί χρόνος στην έρευνα για την ασφάλεια της AI, το λεγόμενο alignment, αλλά και στους νομοθέτες να προετοιμάσουν πλαίσια εποπτείας.
Υπαρκτός φόβος ή επιχειρηματική προπαγάνδα
Η παρέμβαση γίνεται σε μια περίοδο όπου η Anthropic βρίσκεται στην πρώτη γραμμή του ανταγωνισμού με την OpenAI, τη δημιουργό του ChatGPT. Η εταιρεία φέρεται να έχει ολοκληρώσει χρηματοδότηση που την αποτιμά σχεδόν στο 1 τρισ. δολάρια, ενώ έχει ξεκινήσει εμπιστευτικά τη διαδικασία για πιθανή δημόσια εγγραφή.
Οι προειδοποιήσεις της, πάντως, προκαλέσαν αμφιβολίες και ενστάσεις. Στους πολέμους ο επενδυτής David Sacks, που κατηγορεί την Anthropic ότι χρησιμοποιεί τη ρητορική περί ασφάλειας για να επηρεάσει τη ρύθμιση της αγοράς και να περιορίσει ανταγωνιστές, ειδικά τα open-source μοντέλα. Άλλοι βλέπουν ακόμη και στοιχείο μάρκετινγκ στις αναφορές σε κινδύνους, όπως στην περίπτωση του ισχυρού cybersecurity μοντέλου «Mythos».
Η συζήτηση για το μέλλον της ΤΝ ήδη δημιουργεί στρατόπεδα και στοιχίσεις. Ο Ethan Mollick του Wharton σημειώνει ότι τα μεγάλα AI labs είναι χώροι όπου συνυπάρχουν επιχειρηματικά συμφέροντα, ερευνητικές φιλοδοξίες και πραγματική αγωνία για το μέλλον. Από την άλλη, ο Yann LeCun, πρώην chief AI scientist της Meta, επιμένει ότι τα σημερινά μεγάλα γλωσσικά μοντέλα δεν βρίσκονται κοντά στην ανθρώπινη νοημοσύνη ή την AGI.
Το βέβαιο είναι ότι η Anthropic επιχειρεί να μεταφέρει τη συζήτηση από το «τι μπορεί να κάνει σήμερα η AI» στο «ποιος θα ελέγχει την AI όταν αρχίσει να βελτιώνει η ίδια τον εαυτό της». Και αυτό, είτε θεωρείται υπερβολικός φόβος είτε ρεαλιστική προειδοποίηση, είναι πλέον ένα από τα πιο κρίσιμα ερωτήματα της τεχνολογικής εποχής.
