DeepSeek: Ποιος κρύβεται από πίσω – Πώς πέτυχε τη «στιγμή Σπούτνικ» της τεχνητής νοημοσύνης;
Ο Liang Wenfeng ίδρυσε την εταιρεία πριν από δύο χρόνια και δήλωσε ότι στόχος είναι «να μη χάσει χρήματα, ούτε να βγάλει τεράστια κέρδη».
Ο Liang Wenfeng ίδρυσε την εταιρεία πριν από δύο χρόνια και δήλωσε ότι στόχος είναι «να μη χάσει χρήματα, ούτε να βγάλει τεράστια κέρδη».
Έπειτα από χρόνια ανησυχίας στις ΗΠΑ ότι οι φιλοδοξίες τους για την τεχνητή νοημοσύνη θα μπορούσαν να ξεπεραστούν από το Πεκίνο, η μεγαλύτερη απειλή για την ηγεμονία της Silicon Valley δεν προέρχεται από μία από τις τέσσερις μεγάλες εταιρείες τεχνολογίας της Κίνας, αλλά από μία μέχρι πρότινος ελάχιστα γνωστή νεοσύστατη επιχείρηση.
Αντί η Baidu, η Alibaba, η Tencent ή η Xiaomi να ξεπεράσουν το κατάστημα εφαρμογών iOS, αυτό το κατάφερε με το τελευταίο της chatbot αυτή την εβδομάδα η DeepSeek, ταρακουνώντας τις αγορές, μία εταιρεία που ιδρύθηκε πριν από λιγότερο από δύο χρόνια και πιστώνεται με μια «στιγμή Σπούτνικ» στον παγκόσμιο αγώνα ανάπτυξης τεχνητής νοημοσύνης.
Η αναστάτωση προήλθε από τον ισχυρισμό της ότι εκπαίδευσε ένα μοντέλο τεχνητής νοημοσύνης εφάμιλλο του ChatGPT της OpenAI με λιγότερα από 6 εκατ. δολάρια (4,8 εκατ. λίρες). Για λόγους σύγκρισης, η Microsoft, ο κύριος εταίρος του OpenAI, σχεδιάζει να επενδύσει φέτος περίπου 80 δισ. δολάρια σε υποδομές τεχνητής νοημοσύνης.
Ποιος κρύβεται λοιπόν πίσω από την DeepSeek και πώς κατάφερε να επιτύχει ένα τόσο εντυπωσιακό κατόρθωμα που επηρεάζει την αγορά σε τόσο σύντομο χρονικό διάστημα;
Η νεοφυής επιχείρηση ιδρύθηκε τον Μάιο του 2023, είναι το έργο πάθους του Liang Wenfeng, ενός επιχειρηματία hedge fund της χιλιετίας από την επαρχία Guangdong της νότιας Κίνας. Μέρος της επιτυχίας της φαίνεται να προέρχεται από το γεγονός ότι έχει σχεδιαστεί ως ένας καθαρά ερευνητικός οργανισμός και όχι ως μια εμπορική, κερδοσκοπική επιχείρηση.
Σε συνέντευξή του στα κινεζικά Μέσα Ενημέρωσης πέρυσι, μετά το ντεμπούτο ενός προηγούμενου μοντέλου τεχνητής νοημοσύνης που είχε προκαλέσει αίσθηση στους κύκλους της βιομηχανίας, ο Liang δήλωσε: «Η αρχή μας δεν είναι να χάσουμε χρήματα, ούτε να βγάλουμε τεράστια κέρδη… Το σημείο εκκίνησής μας δεν είναι να εκμεταλλευτούμε την ευκαιρία να κάνουμε μια περιουσία, αλλά να είμαστε στην πρώτη γραμμή της τεχνολογίας και να προωθήσουμε την ανάπτυξη ολόκληρου του οικοσυστήματος».
Η ερευνητική εστίαση της DeepSeek χρηματοδοτείται από το hedge fund του Liang, High-Flyer Capital, το οποίο ξεκίνησε το 2015. Αφού σπούδασε μηχανικός ηλεκτρονικών πληροφοριών στο Πανεπιστήμιο Zhejiang, ο Liang απέφυγε τις θέσεις προγραμματιστών σε μεγάλες εταιρείες λογισμικού για να επικεντρωθεί στην εμμονή του με την τεχνητή νοημοσύνη. Με το High-Flyer Capital, ο Liang χρησιμοποίησε την ΤΝ για να εντοπίσει μοτίβα στις τιμές των μετοχών -δημιουργώντας τόνους μετρητών. Το 2021 τα υπό διαχείριση περιουσιακά στοιχεία του φέρεται να ξεπέρασαν τα 100 δισ. γιουάν (11 δισ. λίρες).
Την ίδια χρονιά, άρχισαν να διαδίδονται φήμες ότι ο Liang είχε συγκεντρώσει μια μεγάλη συλλογή από μονάδες επεξεργασίας γραφικών της Nvidia (GPU). Μέχρι το 2021, αναφέρθηκε ότι είχε αγοράσει 10.000 από τα τσιπ, προφανώς για το προσωπικό του χόμπι.
Μόνο μια χούφτα μεγάλες κινεζικές εταιρείες τεχνολογίας διαθέτουν παρόμοια αποθέματα ημιαγωγών της Nvidia. «Πολλοί άνθρωποι θα πίστευαν ότι υπάρχει μια άγνωστη επιχειρηματική λογική πίσω από αυτό, αλλά στην πραγματικότητα, οδηγείται κυρίως από περιέργεια», δήλωσε ο Liang το 2023.
Η περιέργεια ήταν καλά συγχρονισμένη. Το 2022, ο Τζο Μπάιντεν ανακοίνωσε σαρωτικούς ελέγχους εξαγωγών σε ημιαγωγούς που προορίζονταν για την Κίνα, με στόχο να εμποδίσει τη χώρα να αποκτήσει πρόσβαση στον εξοπλισμό που είναι απαραίτητος για την ταχεία ανάπτυξη της Τεχνητής Νοημοσύνης.
Το ισχυρό τσιπ H100 της Nvidia απαγορεύτηκε. Η εταιρεία ανέπτυξε τα λιγότερο ισχυρά τσιπ H800 για την κινεζική αγορά -στα οποία το DeepSeek εκπαίδευσε το μοντέλο του- αν και αυτά απαγορεύτηκαν επίσης το 2023.
«Η μεγαλύτερη πρόκλησή μας δεν ήταν ποτέ τα χρήματα, είναι το εμπάργκο στα high-end chips», δήλωσε ο Liang. Αναφέρεται ότι συμμετέχει προσωπικά στην έρευνα της DeepSeek και έχει μιλήσει για το πώς προτιμά να προσλαμβάνει τοπικά ταλέντα για την πανεπιστημιούπολη της εταιρείας στο Hangzhou, την πόλη της ανατολικής Κίνας όπου εδρεύει και η Alibaba, παρά εργαζόμενους που έχουν σπουδάσει στις ΗΠΑ ή στο εξωτερικό.
Αυτό κάνει την επιτυχία της DeepSeek ακόμη πιο εντυπωσιακή. Οι ΗΠΑ έχουν παραδοσιακά το προβάδισμα στην κούρσα της τεχνητής νοημοσύνης με την Κίνα, κυριαρχώντας στον πιο προηγμένο εξοπλισμό κατασκευής τσιπ και παράγοντας ταλέντα υψηλού επιπέδου από τα πανεπιστήμιά τους.
Το λανσάρισμα του ισχυρού μοντέλου της DeepSeek υποδηλώνει ότι οι Κινέζοι επιστήμονες -όπως είχε προβλεφθεί- βρήκαν τρόπο να παρακάμψουν τους περιορισμούς των ΗΠΑ που σκοπεύουν να τους εμποδίσουν να τους φτάσουν. Αυτό μπορεί να οδηγήσει σε περαιτέρω αυστηροποίηση των αμερικανικών ελέγχων ή να υπονομεύσει την ιδέα ότι μπορούν να λειτουργήσουν αποτελεσματικά. Πέρα από την DeepSeek, πολλές κινεζικές εταιρείες τεχνητής νοημοσύνης αγωνίζονται να αναπτυχθούν χωρίς πρόσβαση σε προηγμένες GPU.
Ο αναλυτής της Κίνας Bill Bishop δήλωσε σε ενημερωτικό δελτίο: «Ό,τι κι αν αποφασίσει η κυβέρνηση Τραμπ για τους ελέγχους των εξαγωγών, πιθανότατα θα προκαλέσει ακόμη μεγαλύτερο διχασμό όσον αφορά την ΤΝ μεταξύ των ΗΠΑ και των στενών φίλων τους και του υπόλοιπου κόσμου, και ιδιαίτερα του παγκόσμιου Νότου». Ορισμένοι αναλυτές και επενδυτές έχουν εκφράσει σκεπτικισμό σχετικά με τους ισχυρισμούς της DeepSeek που συνταράσσουν την αγορά.
«Τα κινεζικά εργαστήρια έχουν περισσότερα H100 από ό,τι νομίζει ο κόσμος», δήλωσε ο Alexandr Wang, ένας Αμερικανός επιχειρηματίας στον τομέα της τεχνητής νοημοσύνης, σε συνέντευξή του στο CNBC. Ο Γουάνγκ δήλωσε ότι πιστεύει ότι η DeepSeek έχει ένα απόθεμα προηγμένων τσιπ που δεν έχει αποκαλύψει δημοσίως λόγω των αμερικανικών κυρώσεων. Η Karen Hao, δημοσιογράφος AI, δήλωσε στο X ότι η επιτυχία της DeepSeek προήλθε από το μικρό της μέγεθος. «Καινοτομούσε λόγω των περιορισμών της και όχι παρά τους περιορισμούς της».
Η εταιρεία είναι επίσης γνωστό ότι πληρώνει καλά για τα κορυφαία ταλέντα, αποσπώντας προγραμματιστές με προσφορές εργασίας από μεγαλύτερες εταιρείες, όπως η Nvidia. Οι καταχωρίσεις θέσεων εργασίας για προγραμματιστές στην DeepSeek στην κινεζική ιστοσελίδα προσλήψεων Zhipin διαφημίζουν μισθούς έως και 60.000 γιουάν το μήνα (περίπου 6.600 λίρες Αγγλίας). Ο μέσος μισθός στην Tencent και σε άλλες μεγάλες εταιρείες τεχνολογίας είναι περίπου 35.000 γιουάν το μήνα.
Όσο για τον ίδιο τον Liang, παραμένει μακριά από τα φώτα της δημοσιότητας. Ένας σχολικός φίλος που έδωσε συνέντευξη στον κινεζικό Τύπο δήλωσε: «Ο Liang είναι ο μόνος που μπορεί να κάνει κάτι τέτοιο: Πριν από λίγες ημέρες, του έστειλα ένα μήνυμα για να τον συγχαρώ. Είπε ότι θα επέστρεφε στην πόλη καταγωγής του για το σεληνιακό νέο έτος, αλλά ότι θα κρυβόταν».
Με πληροφορίες από The Guardian
ολες οι ειδησεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στο Newpost.gr