Η κινεζική startup DeepSeek λανσάρει αναβαθμισμένο μοντέλο AI

Η startup DeepSeek αναβαθμίζει το μοντέλο τη εντείνοντας τον ανταγωνισμό με τις αμερικανικές και κινεζικές τεχνολογικές πλατφόρμες

DeepSeek © EPA/SALVATORE DI NOLFI

Η κινεζική startup τεχνητής νοημοσύνης DeepSeek κυκλοφόρησε την Πέμπτη το DeepSeek-V3.1, ένα αναβαθμισμένο μοντέλο με υβριδική δομή συμπερασμού, ταχύτερη ταχύτητα σκέψης και ισχυρότερη ικανότητα πράξης, σύμφωνα με δήλωση της εταιρείας που δημοσιεύτηκε στο WeChat.

Η εταιρεία θα προσαρμόσει επίσης το κόστος χρήσης του API του μοντέλου, μιας πλατφόρμας που επιτρέπει στους προγραμματιστές άλλων εφαρμογών και διαδικτυακών προϊόντων να ενσωματώνουν τα μοντέλα τεχνητής νοημοσύνης της, από τις 6 Σεπτεμβρίου, σύμφωνα με την ανακοίνωση της startup.

Η DeepSeek παρουσίασε μια ενημέρωση ενός παλαιότερου μοντέλου που, όπως ισχυρίζεται, ξεπερνά το πρωτοποριακό R1 σε βασικά κριτήρια αξιολόγησης, διατηρώντας την κινεζική startup στο παιχνίδι, ενώ ο κλάδος αναμένει το επόμενο κορυφαίο προϊόν της.

Το V3.1 δίνει απαντήσεις σε ερωτήματα πολύ πιο γρήγορα και σηματοδοτεί το πρώτο βήμα της startup προς τη δημιουργία ενός AI πράκτορα, ανέφερε η DeepSeek σε μια ανάρτηση στο WeChat την Πέμπτη. Η DeepSeek παρουσίασε για πρώτη φορά το V3.1 νωρίτερα αυτή την εβδομάδα, αλλά η πλατφόρμα μόλις έφτασε στο portal Hugging Face. Η έκδοση έχει προσαρμοστεί ώστε να λειτουργεί με την επόμενη γενιά AI chips κινεζικής κατασκευής, ανέφερε η DeepSeek σε ξεχωριστό μήνυμα.

Η DeepSeek συγκλόνισε τη Silicon Valley τον Ιανουάριο με το ισχυρό αλλά χαμηλού κόστους R1 και έκτοτε παραμένει στην πρώτη γραμμή της αυξανόμενης τάσης ανάπτυξης της κινεζικής τεχνητής νοημοσύνης. Την Πέμπτη, παρουσίασε επίσης ένα νέο πρόγραμμα τιμολόγησης για την ενημέρωση της παλαιότερης έκδοσης V3, αυξάνοντας τις τιμές σε ορισμένες περιπτώσεις και καταργώντας τις μειωμένες τιμές για τις βραδινές ώρες. Ωστόσο, μείωσε τα τέλη για ορισμένες περιπτώσεις χρήσης. Οι αλλαγές θα τεθούν σε ισχύ στις 6 Σεπτεμβρίου.

Τα μοντέλα της DeepSeek έχουν προκαλέσει τις καθιερωμένες εταιρείες των ΗΠΑ, όπως η OpenAI, και έχουν αποδείξει πώς οι κινεζικές εταιρείες μπορούν να κάνουν άλματα στην τεχνητή νοημοσύνη χωρίς τα πιο προηγμένα ημιαγωγικά.

Οι παρατηρητές του κλάδου αναμένουν την κυκλοφορία του διαδόχου του R1, ο οποίος αναμενόταν να εμφανιστεί νωρίτερα φέτος. Τα τοπικά μέσα ενημέρωσης αποδίδουν την καθυστέρηση στην αποφασιστικότητα του ιδρυτή Liang Wenfeng να το κάνει σωστά, ακόμη και καθώς συνεχίζει να διευθύνει την κερδοφόρα εταιρεία High-Flyer Asset Management. Άλλοι έχουν εικάσει για διάφορα προβλήματα στην εκπαίδευση ή την ανάπτυξη.

Ταυτόχρονα, οι ανταγωνιστές, από την Alibaba Group Holding έως την Tencent Holding, έχουν διατηρήσει έναν φρενήρη ρυθμό ανάπτυξης και ενημέρωσης των μοντέλων τεχνητής νοημοσύνης. Τα μοντέλα Qwen της Alibaba, ειδικότερα, έχουν αποκτήσει μεγάλη δημοτικότητα.