Δύο νέες εκδόσεις ενός πειραματικού μοντέλου τεχνητής νοημοσύνης που είχε δώσε σε κυκλοφορία πριν από μερικές εβδομάδες παρουσίασε η κινεζική DeepSeek. Στις νέες αυτές εκδόσεις έχουν προστεθεί καινούριες δυνατότητες που, σύμφωνα με τη startup, θα βοηθήσουν στο να συνδυάζεται η συλλογιστική με την αυτόνομη εκτέλεση ορισμένων ενεργειών.
Όπως αναφέρει το Bloomberg, το μοντέλο που κυκλοφόρησε τον Σεπτέμβριο ονομαζόταν DeepSeek-V3.2-Exp, υποδηλώνοντας τον πειραματικό του χαρακτήρα. Αντιθέτως, η πιο πρόσφατη έκδοση ονομάζεται απλώς DeepSeek-V3.2. Σύμφωνα με τη startup, η νέα υπηρεσία έχει φτάσει τις επιδόσεις του κορυφαίου μοντέλου GPT-5 της OpenAI σε πολλαπλές δοκιμασίες συλλογισμού, γεγονός που υποδηλώνει ότι τα κινεζικά ανοιχτού κώδικα συστήματα παραμένουν ανταγωνιστικά έναντι εκείνων της Σίλικον Βάλι.
Η DeepSeek ανέφερε επίσης ότι η έκδοση V3.2 συνδυάζει την ικανότητα μίμησης ανθρώπινου συλλογισμού με τη δυνατότητα χρήσης εργαλείων όπως μηχανές αναζήτησης, αριθμομηχανές και εκτελεστές κώδικα.
«Το DeepSeek-V3.2 είναι το πρώτο μας μοντέλο που ενσωματώνει τη σκέψη απευθείας στη χρήση εργαλείων, και υποστηρίζει επίσης χρήση εργαλείων τόσο σε λειτουργία σκέψης όσο και σε μη-σκέψης», ανέφερε η εταιρεία σε ανάρτηση στο X.
Η DeepSeek, η οποία είχε αιφνιδιάσει τον τεχνολογικό κόσμο τον Ιανουάριο με ένα επαναστατικό μοντέλο τεχνητής νοημοσύνης, είχε προηγουμένως περιγράψει την πειραματική έκδοση ως ένα βήμα προς την επόμενη γενιά τεχνητής νοημοσύνης.
Η δεύτερη έκδοση που κυκλοφόρησε η DeepSeek, V3.2-Speciale, εστιάζει σε μαθηματικούς υπολογισμούς και άλλες δυνατότητες μακροχρόνιου συλλογισμού. Η startup ανέφερε ότι στόχος είναι «να ωθήσουμε τις δυνατότητες συμπερασματολογίας των μοντέλων ανοιχτού κώδικα στα όριά τους και να εξερευνήσουμε τα σύνορα των ικανοτήτων των μοντέλων».
Το DeepSeek-V3.2-Speciale ταιριάζει με τις επιδόσεις του νεότερου Gemini-3 Pro της Google και απέδωσε σε επίπεδο χρυσού μεταλλίου σε τυποποιημένες εξετάσεις όπως η Διεθνής Μαθηματική Ολυμπιάδα και η Διεθνής Ολυμπιάδα Πληροφορικής, σύμφωνα με την εταιρεία.
Η DeepSeek δήλωσε ότι έχει δημιουργήσει έναν νέο τρόπο εκπαίδευσης «πρακτόρων ΤΝ», δηλαδή προγραμμάτων λογισμικού σχεδιασμένων να ενεργούν αυτόνομα για την επίτευξη στόχων μέσω αλληλεπίδρασης με το περιβάλλον τους, ανάλυσης δεδομένων και λήψης αποφάσεων χωρίς συνεχή ανθρώπινη παρέμβαση.
Πρόκειται για ένα νέο σημάδι ότι το επιδραστικό εργαστήριο τεχνητής νοημοσύνης εντείνει την ερευνητική του δυναμική με την τελευταία κυκλοφορία του, προκειμένου να κάνει την επεξεργασία ΤΝ ταχύτερη και πιο αποδοτική. Μετά το μοντέλο-τομή που ανέτρεψε τον χώρο της τεχνητής νοημοσύνης τον Ιανουάριο, η startup προχωρά τώρα με νέες καινοτομίες για να εδραιώσει το προβάδισμά της στον αγώνα της Κίνας για την ΤΝ. Μόλις την προηγούμενη εβδομάδα, η εταιρεία είχε κυκλοφορήσει ένα νέο ανοικτό μοντέλο, το DeepSeekMath-V2, το οποίο έδειξε ισχυρές ικανότητες απόδειξης θεωρημάτων στα μαθηματικά.
«Το DeepSeek-V3.2 επιτυγχάνει παρόμοιες επιδόσεις με το Kimi-k2-thinking και το GPT-5 σε πολλαπλές δοκιμασίες συλλογισμού», ανέφερε η startup σε συνοδευτική τεχνική αναφορά με τίτλο «DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models».