Δείκτης
Το περασμένο Σαββατοκύριακο, μια τεχνητή νοημοσύνη που ονομάζεται DeepSeek, που αναπτύχθηκε στην Κίνα, προκαλεί σάλο στον κόσμο της τεχνολογίας και προκαλεί την κατακόρυφη πτώση της μετοχικής αξίας αμερικανικών κολοσσών όπως η NVIDIA, η Google, η Meta και η Microsoft κατά περισσότερο από 1 τρισεκατομμύριο δολάρια. Κατανοήστε πώς λειτουργεί και πώς μπορεί να επηρεάσει τον κόσμο της τεχνολογίας, αλλά συγκεκριμένα το ChatGPT του OpenAI.
Τι είναι το DeepSeek
Η DeepSeek είναι μια κινεζική εταιρεία τεχνητής νοημοσύνης, που δημιουργήθηκε το 2023 από Liang Wenfeng, Κινέζος επιχειρηματίας και συνιδρυτής του ποσοτικού hedge fund High-Flyer. Αυτό το αμοιβαίο κεφάλαιο, διάσημο για τη χρήση τεχνικών μηχανικής μάθησης στις επενδύσεις μετοχών, είναι επίσης ο τρέχων χρηματοδότης της έρευνας AI της εταιρείας.
Από το 2023, η εταιρεία προσελκύει την παγκόσμια προσοχή λόγω της ταχείας ανάπτυξης των γλωσσικών της μοντέλων ή LLM.
Ανάπτυξη χαμηλού κόστους
Το κύριο πλεονέκτημα των μοντέλων είναι το κόστος ανάπτυξής τους. Σε ένα άρθρο που κυκλοφόρησε πρόσφατα, η εταιρεία εξήγησε ότι το μοντέλο γλώσσας της DeepSeek-V3 μεταχειρισμένος 2 χιλιάδες κάρτες NVIDIA H800, που είναι ήδη σχετικά παλιά, για προπόνηση στο α συνολικό κόστος 5,5 εκατομμυρίων δολαρίων.
Για σύγκριση, αυτό είναι μόνο ένα κλάσμα του κόστους εκπαίδευσης ενός μοντέλου όπως το Llama 3.3 του Meta, το οποίο μόνο φέτος αναμένεται να ξοδέψει περισσότερα από 65% δισεκατομμύρια δολάρια στη βελτίωσή του. Σε αυτή τη σύγκριση, τα έξοδα του DeekpSeek καταλήγουν να είναι ακόμη χαμηλότερα από τον ετήσιο μισθό ορισμένων στελεχών στην εταιρεία της Meta. Σύμφωνα με αναλυτές, οι μειώσεις κόστους φτάνουν εντυπωσιακές 95%.
Αυτό το επίτευγμα βάζει τέλος στο παράδειγμα ότι απαιτούνται υψηλές επενδύσεις σε υποδομές κέντρων δεδομένων και ηλεκτρική ενέργεια για την εκπαίδευση των AI, καθιστώντας το DeepSeek μια τεχνητή νοημοσύνη που δεν είναι μόνο φθηνότερη, αλλά και πιο οικολογικά βιώσιμη.
Θεωρητικά, αντί να χρησιμοποιούν εξειδικευμένα κέντρα δεδομένων με πολύ ακριβές GPU σχεδιασμένες για υψηλές απαιτήσεις τεχνητής νοημοσύνης, τα μοντέλα DeepSeek θα μπορούσαν να εκπαιδευτούν ακόμη και σε οικιακούς υπολογιστές, με παραδοσιακές GPU, κάτι που προκαλεί έκπληξη και φόβο σε εταιρείες όπως η NVIDIA, η οποία αξιοποιήθηκε τόσο πολύ από την πρόσφατη βιασύνη για την κατασκευή κέντρων δεδομένων από εταιρείες που αναζητούν μερίδιο σε αυτή την αγορά.
Για το λόγο αυτό, σε αυτό που έχει γίνει γνωστό ως το «Ημέρα πανικού DeepSeek» ou «Ημέρα πανικού DeepSeek», Σε ελεύθερη μετάφραση, η 27η Ιανουαρίου χαρακτηρίστηκε από πτώση δισεκατομμυρίων δολαρίων στις μετοχές του NASDAQ, το χρηματιστήριο για αμερικανικές εταιρείες υψηλής τεχνολογίας, φτάνοντας το 3,5% του συνόλου των συναλλαγών. Ο ανταγωνιστής του ChatGPT έχει τα πάντα για να είναι επιτυχημένος.
DeepSeek-V3 και DeepSeek-R1
Παράδειγμα αποτελεσματικότητας αποτελούν και τα μοντέλα της εταιρείας. Ο DeepSeek-V3, για παράδειγμα, διαθέτει εντυπωσιακή απόδοση σε πολλαπλά σημεία αναφοράς, ενώ απαιτεί σημαντικά λιγότερους πόρους από ανταγωνιστές όπως το Llama 3.3 της Meta. Και το DeepSeek-R1, που κυκλοφόρησε τον Ιανουάριο του 2025, εστιάζει σε συλλογιστικές εργασίες και προκαλεί το μοντέλο o1 του OpenAI με τα προηγμένα χαρακτηριστικά του.
Στην ουσία, και οι δύο επιλογές κινεζικών μοντέλων τεχνητής νοημοσύνης μαθαίνουν αλληλεπιδρώντας με το περιβάλλον τους και λαμβάνοντας σχόλια για τις ενέργειές τους, παρόμοια με το πώς μαθαίνουν οι άνθρωποι μέσω της εμπειρίας. Αυτό τους επιτρέπει να αναπτυχθούν πιο εξελιγμένες συλλογιστικές δεξιότητες και να προσαρμοστούν πιο αποτελεσματικά στις νέες καταστάσεις. Αυτή η προσέγγιση είναι επίσης φθηνότερη από την «μάθηση με επίβλεψη από τον άνθρωπο» που χρησιμοποιείται από τους ανταγωνιστές.
Ένα άλλο πλεονέκτημα αυτού του κινεζικού AI είναι το εξοικονόμηση πόρων. Αντί να χρησιμοποιούν όλες τις παραμέτρους του μοντέλου για να απαντήσουν σε ένα ερώτημα, τα μοντέλα του DeepSeek επιλέγουν μόνο μερικές «συγκεκριμένες παραμέτρους» ή «ειδικούς» για το θέμα. Αυτή η επιλεκτική ενεργοποίηση μειώνει σημαντικά το υπολογιστικό κόστος και αυξάνει την απόδοση του μοντέλου.
Εξηγώντας το με απλούστερο τρόπο, θα ήταν σαν να έχετε μια μεγάλη ομάδα ειδικών διαθέσιμη για όλους τους τύπους εργασιών, αλλά να καλείτε μόνο αυτούς που είναι καταλληλότεροι να το φέρουν εις πέρας σε μια συγκεκριμένη περίπτωση, διασφαλίζοντας αποτελεσματική χρήση και τεχνογνωσία στην εξυπηρέτηση.
O DeepSeek-V3 απασχολεί επίσης τεχνικές απόσταξης, πράγμα που σημαίνει ότι μεταφέρει γνώση και δυνατότητες από μεγαλύτερα μοντέλα σε μικρότερα, πιο αποτελεσματικά μοντέλα. Είναι σαν ένας δάσκαλος να μεταφέρει τις γνώσεις του σε έναν μαθητή, επιτρέποντας στον μαθητή να εκτελέσει εργασίες με παρόμοια επάρκεια αλλά με λιγότερη εμπειρία ή πόρους.
Το αποτέλεσμα είναι μια τεχνητή νοημοσύνη που καταλαμβάνει λιγότερο χώρο και πόρους, με υψηλή απόδοση για εργασία σε μικρότερες συσκευές, όπως smartphone και notebook. Για να καταστήσει την εφαρμογή διαθέσιμη για smartphone αλλά και στην web έκδοση, η εταιρεία χρησιμοποίησε το DeepSeek R1 ως βάση και το μετέτρεψε σε εφαρμογή.
Μοντέλο ανοιχτού κώδικα
Εκτός από το συνδυασμό τεχνικών απόδοσης και απόδοσης, τα μοντέλα επωφελούνται επίσης από τη συνεργασία που είναι εγγενής στο σχεδιασμό έργων. ανοιχτός κώδικας (ή ανοιχτού κώδικα, στα αγγλικά).
Εδώ, σε αντίθεση με μια εταιρεία όπως η OpenAI, η οποία εργάζεται ιδιωτικά για την ανάπτυξη AI, τα μοντέλα της DeepSeek έχουν τον κώδικα τους διαθέσιμο στον Ιστό και μπορούν να προσπελαστούν, να δοκιμαστούν και ακόμη και να διορθωθούν από την παγκόσμια κοινότητα προγραμματιστών, γεγονός που αντικατοπτρίζει επίσης περισσότερη διαφάνεια και εμπιστοσύνη στα αποτελέσματα που παρουσιάζονται.
Μάλιστα, η εταιρεία θέλει να ενθαρρύνει οποιονδήποτε να δοκιμάσει τα μοντέλα της και εκδίδει άδειες για τους επαγγελματίες της για να διευκολύνει τις άλλες εταιρείες να τα χρησιμοποιούν.
Η στρατηγική ενισχύει επίσης την ανταγωνιστικότητα, προσελκύοντας ταλέντα και αναδεικνύει την ηγετική θέση της DeepSeek, σε ένα είδος δωρεάν μάρκετινγκ. Η εταιρεία δεν επωφελείται άμεσα από αυτό, αλλά θα επωφεληθεί από τη μαζική υιοθέτηση του μοντέλου, έχοντας τη δυνατότητα να έχει έσοδα μέσω συμπληρωματικών υπηρεσιών, όπως τεχνική υποστήριξη ή premium εκδόσεις, ενώ θα καλλιεργεί ένα συνεργατικό και καινοτόμο οικοσύστημα.
Νούμερο 1 στα καταστήματα εφαρμογών
Η περιέργεια για το DeepSeek δεν ήταν μόνο μεταξύ των CEO και των μηχανικών τεχνολογίας.
Κυκλοφόρησε στις 20 Ιανουαρίου, το R1, Εφαρμογή DeepSeek για iPhone και Android smartphones, φαίνεται να ακολουθεί την επιτυχημένη πορεία του ανταγωνιστή ChatGPT. Είναι ήδη η εφαρμογή με τις περισσότερες λήψεις στο αμερικανικό Apple App Store και η δεύτερη στη Βραζιλία, πίσω μόνο από τον ανταγωνιστή OpenAI.
Na Play Store, κατάστημα Android, η επιτυχία είναι επίσης αναμφισβήτητη: παγκοσμίως, το κινεζικό chatbot έχει ήδη εγκατασταθεί περισσότερες από ένα εκατομμύριο φορές.
Ο Sam Altman, ιδρυτής και σημερινός διευθύνων σύμβουλος του OpenAI, μίλησε για την επιτυχία του DeepSeek. Ανέφερε ότι παρακολουθεί τι μπορεί να κάνει η κινεζική τεχνητή νοημοσύνη και ότι το πρώτο μοντέλο είναι εντυπωσιακό. Δείτε τα tweets και τις μεταφράσεις παρακάτω.
Το deepseek r1 είναι ένα εντυπωσιακό μοντέλο, ειδικά σε σχέση με το τι μπορούν να προσφέρουν για την τιμή. Προφανώς θα παραδώσουμε πολύ καλύτερα μοντέλα και είναι επίσης θεμιτά αναζωογονητικό να έχουμε έναν νέο ανταγωνιστή! Θα κάνουμε κάποιες εκδόσεις.
Αλλά το πιο σημαντικό, είμαστε ενθουσιασμένοι που συνεχίζουμε να εκτελούμε τους στόχους μας και πιστεύουμε ότι περισσότερος υπολογισμός είναι πιο σημαντικός τώρα από ποτέ για να πετύχουμε στην αποστολή μας.
Ο κόσμος θα θέλει να χρησιμοποιήσει ΠΟΛΛΗ AI και πραγματικά θα εκπλαγεί από τα μοντέλα επόμενης γενιάς που έρχονται. Ανυπομονούμε να σας φέρουμε όλο το AGI και όχι μόνο.
Ο Sam Altman για την επιτυχία του κινεζικού AI DeepSeek.
Συνέπειες και πολιτική προκατάληψη
Με την επιτυχία όμως δημιουργούνται και υποψίες. Οι ειδικοί διερωτώνται εάν ο συνολικός αριθμός των GPU που χρησιμοποιήθηκαν για την εκπαίδευση των μοντέλων του DeepSeek ήταν ελλιπής αναφορά, με την πρόθεση να κρύψουν τη χρήση του υλικού NVIDIA που πρόσφατα απαγορευόταν να πωλείται στην Κίνα, λόγω του εμπορικού πολέμου με τις Ηνωμένες Πολιτείες. Όμως η εταιρεία αρνείται αυτό το γεγονός, δηλώνοντας ότι κατάφερε να εκπαιδεύσει το μοντέλο της ακόμη και με GPU χαμηλής κατανάλωσης.
Υπάρχουν επίσης σημάδια λογοκρισίας στο εργαλείο, σύμφωνα με τις αρχές ή την πολιτική προκατάληψη του Κινεζικού Κομμουνιστικού Κόμματος. Για παράδειγμα, όταν ρωτήθηκε για το «Σφαγή στην πλατεία Τιενανμέν του 1989 στο Πεκίνο», όπου εκατοντάδες ακτιβιστές σκοτώθηκαν ή τραυματίστηκαν από τον κινεζικό στρατό, η AI αρνείται να απαντήσει στην ερώτηση.
Το ίδιο συμβαίνει όταν το AI ρωτάται για τη σύγκρουση μεταξύ Κίνας και Ταϊβάν. Το DeepSeek αναφέρει ότι η Ταϊβάν είναι μέρος της Κίνας και αυτό «Η κινεζική κυβέρνηση είναι προσηλωμένη στην αρχή της μίας Κίνας και επιδιώκει την ειρηνική επανένωση της χώρας.
Τι έπεται?
Η δυνατότητα ύπαρξης τόσο αποτελεσματικών μοντέλων τεχνητής νοημοσύνης, με σημαντικά χαμηλότερο κόστος υποδομής, κάνει τους επενδυτές να ξανασκεφτούν την αγορά ή ακόμα και την πώληση των μετοχών τους σε εταιρείες τεχνολογίας που επικεντρώνονται σε αυτόν τον τομέα.
Ένας από τους θρύλους του επιχειρηματικά κεφάλαια Αμερικανός, marc Andreessen, βλέπει την εμφάνιση του DeepSeek ως το «Η στιγμή του Σπούτνικ του AI», σε σχέση με την ιστορική πρώτη εκτόξευση δορυφόρων σε τροχιά το 1957, η οποία σηματοδότησε τη στιγμή που η Σοβιετική Ένωση ξεπέρασε προσωρινά τις Ηνωμένες Πολιτείες στον τομέα της διαστημικής τεχνολογίας.
Γεγονός είναι ότι η αμερικανική υπεροχή στον τομέα της τεχνητής νοημοσύνης έχει τεθεί υπό αμφισβήτηση. Και, για το λόγο αυτό, είναι πιθανό να ανακοινωθούν αντίποινα από την αμερικανική κυβέρνηση, ίσως μέσω περισσότερων κυρώσεων για την εμπορευματοποίηση αμερικανικών τεχνολογιών και τσιπ σε κινεζικές εταιρείες.
Σε αντίδραση στην υπόθεση, ο νέος Πρόεδρος Ντόναλντ Τραμπ χαρακτήρισε την άνοδο της κινεζικής εταιρείας DeepSeek «ένα τηλεφώνημα αφύπνισης» για την τεχνολογική βιομηχανία των Ηνωμένων Πολιτειών, ένα σημάδι ότι μια αντίδραση θα πρέπει να έρθει σύντομα.
Θα παρακολουθήσουμε στενά το θέμα. Στο μεταξύ, πες μας σχόλια: Πιστεύετε ότι το DeepSeek μπορεί να το αναλάβει Ηγεσία του ChatGPT?
Δείτε το βίντεο
Δείτε επίσης
Με πληροφορίες: Yahoo l Ground Ενημέρωση l Πληροφορίες Χρήματα l Forbes (1 e 2)
Ανακαλύψτε περισσότερα για το Showmetech
Εγγραφείτε για να λαμβάνετε τα τελευταία μας νέα μέσω email.