Ένα ελάχιστα γνωστό εργαστήριο τεχνητής νοημοσύνης από την Κίνα έχει προκαλέσει πανικό σε όλη τη Silicon Valley, αφού κυκλοφόρησε μοντέλα τεχνητής νοημοσύνης που μπορούν να ξεπεράσουν τα καλύτερα της Αμερικής, παρόλο που κατασκευάζονται πιο φθηνά και με λιγότερο ισχυρά τσιπ.

Η DeepSeek, όπως ονομάζεται το εργαστήριο, παρουσίασε ένα δωρεάν γλωσσικό μοντέλο ανοιχτού κώδικα στα τέλη Δεκεμβρίου, το οποίο λέει ότι χρειάστηκε μόνο δύο μήνες και λιγότερο από 6 εκατομμύρια δολάρια για να κατασκευαστεί, χρησιμοποιώντας τσιπ μειωμένης ικανότητας από τη Nvidia, το μοντέλο H800.

Η μητρική του TikTok «ρίχνει» 20 δισ. δολάρια το 2025 στην AI

Προφανώς, οι νέες εξελίξεις έχουν σημάνει συναγερμό, σύμφωνα με το CNBC, σχετικά με το εάν η παγκόσμια πρωτιά της Αμερικής στην τεχνητή νοημοσύνη σταδιακά συρρικνώνεται και θέτει υπό αμφισβήτηση τις τεράστιες δαπάνες των Big Tech για την κατασκευή μοντέλων τεχνητής νοημοσύνης και κέντρων δεδομένων.

Σε ένα σύνολο δοκιμών αναφοράς τρίτων, το μοντέλο της DeepSeek ξεπέρασε το Meta Llama 3.1, το GPT-4o της OpenAI και το Claude Sonnet 3.5 της Anthropic με ακρίβεια που κυμαίνεται από επίλυση σύνθετων προβλημάτων έως μαθηματικά και κωδικοποίηση.

Το DeepSeek κυκλοφόρησε τη Δευτέρα το r1, ένα μοντέλο συλλογισμού που ξεπέρασε επίσης το τελευταίο o1 της OpenAI σε πολλές από αυτές τις δοκιμές τρίτων.

«Το νέο μοντέλο της DeepSeek, είναι εξαιρετικά εντυπωσιακό τόσο από την άποψη του πώς έχουν κάνει πραγματικά αποτελεσματικά ένα μοντέλο ανοιχτού κώδικα που κάνει αυτόν τον υπολογισμό του χρόνου συμπερασμάτων και είναι υπερ-υπολογιστικό», δήλωσε ο διευθύνων σύμβουλος της Microsoft, Σάτια Ναντέλα, στο Παγκόσμιο Οικονομικό Φόρουμ στο Νταβός της Ελβετίας την Τετάρτη. «Θα πρέπει να πάρουμε πολύ, πολύ σοβαρά τις εξελίξεις από την Κίνα».

DeepSeek και αμερικανικοί περιορισμοί

Η DeepSeek έπρεπε επίσης να πλοηγηθεί στους αυστηρούς περιορισμούς ημιαγωγών που η κυβέρνηση των ΗΠΑ έχει επιβάλει στην Κίνα, αποκόπτοντας τη χώρα από την πρόσβαση στα πιο ισχυρά τσιπ, όπως τα H100 της Nvidia. Οι πιο πρόσφατες εξελίξεις υποδηλώνουν ότι η DeepSeek είτε βρήκε έναν τρόπο να παρακάμψει τους κανόνες είτε ότι οι έλεγχοι των εξαγωγών δεν επιτυγχάνουν τους στόχους της Ουάσιγκτον.

«Μπορούν να πάρουν ένα πολύ καλό, μεγάλο μοντέλο και να χρησιμοποιήσουν μια διαδικασία που ονομάζεται “απόσταξη”», δήλωσε ο γενικός συνεργάτης της Benchmark Τσετάν Πουταγκούντα. «Βασικά χρησιμοποιείτε ένα πολύ μεγάλο μοντέλο για να βοηθήσετε το μικρό σας μοντέλο να γίνει έξυπνο στο αντικείμενο που θέλετε να γίνει έξυπνο. Αυτό είναι πραγματικά πολύ οικονομικό».

Λίγα είναι γνωστά για το συγκεκριμένο κινεζικό εργαστήριο και τον ιδρυτή του, Λιανγκ Γουενφένγκ. Η DeepSeek γεννήθηκε από ένα κινεζικό hedge fund που ονομάζεται High-Flyer Quant που διαχειρίζεται περίπου 8 δισεκατομμύρια δολάρια σε περιουσιακά στοιχεία, σύμφωνα με δημοσιεύματα.

Η αναγκαιότητα είναι η μητέρα της εφεύρεσης

Αλλά η DeepSeek δεν είναι η μόνη κινεζική εταιρεία που ταράζει τα νερά της αμερικανικής κυριαρχίας. Ο κορυφαίος ερευνητής τεχνητής νοημοσύνης Κάι-Φου Λι είπε στο CNBC ότι η startup του 01.ai εκπαιδεύτηκε χρησιμοποιώντας μόνο 3 εκατομμύρια δολάρια. Η μητρική εταιρεία του TikTok ByteDance κυκλοφόρησε την Τετάρτη μια ενημέρωση στο μοντέλο της που ισχυρίζεται ότι ξεπερνά το o1 του OpenAI σε μια βασική δοκιμή αναφοράς.

«Η αναγκαιότητα είναι η μητέρα της εφεύρεσης», δήλωσε στο CNBC ο CEO της Perplexity, Αραβίντ Σρινιβάς. «Επειδή έπρεπε να βρουν λύσεις, στην πραγματικότητα κατέληξαν να χτίσουν κάτι πολύ πιο αποτελεσματικό».

Ακολουθήστε τον ot.grστο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στον ot.gr

Latest News

Πρόσφατα Άρθρα Tεχνητή νοημοσύνη
ByteDance: Η μητρική του TikTok «ρίχνει» 20 δισ. δολάρια το 2025 στην AI 
Tεχνητή νοημοσύνη |

Η μητρική του TikTok «ρίχνει» 20 δισ. δολάρια το 2025 στην AI 

Η κινεζική εταιρεία ByteDance σχεδιάζει να δαπανήσει περίπου το ήμισυ του ποσού στο εξωτερικό σε υποδομές που σχετίζονται με την τεχνητή νοημοσύνη, κυρίως κέντρα δεδομένων και εξοπλισμό δικτύωσης

Stargate Project: Επένδυση-μαμούθ από OpenAI, SoftBank, Oracle στην AI – Οι αμφιβολίες
Tεχνητή νοημοσύνη |

Ο Τραμπ ανακοινώνει το Stargate Project των 500 δισ. ενώ ο Μασκ λέει ότι δεν υπάρχουν... χρήματα

Το Stargate Project θα έχει διάρκεια 4 χρόνια και το κόστος του θα ανέλθει στα 500 δισ. δολάρια - Αμφιβολίες από τον Ίλον Μασκ για την ύπαρξη ρευστότητας - Εκτός πλάνου η Microsoft