La vague d'IA déferle sur le monde, DeepSeek émerge avec force et provoque des secousses sur le marché
Récemment, un événement marquant s'est produit dans le domaine de l'IA. Un modèle d'IA chinois nommé DeepSeek a dépassé pour la première fois ChatGPT en termes de téléchargements sur l'App Store américain, atteignant la première place. Ce phénomène a non seulement suscité un large intérêt dans le monde de la technologie, des investissements et des médias, mais a également provoqué une brève panique sur le marché des capitaux américains.
En conséquence, les actions de plusieurs géants de la technologie ont chuté à des degrés divers. Nvidia a enregistré une baisse de 5,3 %, ARM de 5,5 %, Broadcom de 4,9 % et TSMC de 4,5 %. D'autres sociétés comme Micron, AMD et Intel ont également connu des baisses correspondantes. Les contrats à terme du Nasdaq 100 ont chuté de -400 points, s'apprêtant à enregistrer la plus forte baisse en une seule journée depuis le 18 décembre. Selon des statistiques incomplètes, la capitalisation boursière américaine pourrait avoir disparu de plus de 1 000 milliards de dollars lors des transactions de lundi, ce qui équivaut à un tiers de la capitalisation totale du marché de la cryptographie.
Le marché des cryptomonnaies n'a également pas échappé à cette tendance baissière. Le prix du Bitcoin est tombé en dessous de 100500 dollars, avec une baisse de 4,48 % sur 24 heures. L'Ethereum est tombé en dessous de 3200 dollars, avec une baisse de 3,83 % sur 24 heures. De nombreux investisseurs sont perplexes face à cette volatilité soudaine du marché, certains pensant que cela pourrait être lié à une réduction des attentes de taux d'intérêt de la Réserve fédérale ou à d'autres facteurs macroéconomiques.
L'essor de DeepSeek a suscité une nouvelle réflexion sur les modèles de développement de l'IA. Contrairement à des entreprises comme OpenAI ou Meta, DeepSeek ne s'est pas développé grâce à un capital solide et à de nombreuses ressources matérielles. En comparaison, OpenAI a été fondée il y a 10 ans, compte 4500 employés et a levé 6,6 milliards de dollars. Une certaine entreprise de médias sociaux a même dépensé 60 milliards de dollars pour développer un centre de données IA de la taille de Manhattan. DeepSeek, quant à elle, a été fondée depuis moins de 2 ans, compte seulement 200 employés, a un coût de développement de moins de 10 millions de dollars et n'a pas acheté de GPU haut de gamme en grande quantité.
Ce contraste pousse les professionnels du secteur à se demander : comment les géants technologiques traditionnels peuvent-ils rivaliser avec DeepSeek ? Le succès de DeepSeek reflète non seulement un avantage en termes de coûts sur le plan du capital et de la technologie, mais il remet également en question les idées préconçues sur le développement de l'IA.
Le vice-président des produits d'une entreprise technologique bien connue a commenté sur les réseaux sociaux que l'histoire de DeepSeek illustre un exemple typique d'innovation disruptive. Les entreprises existantes optimisent leurs processus actuels, tandis que les perturbateurs repensent les méthodes fondamentales. DeepSeek propose une nouvelle approche : que se passerait-il si nous faisions cela de manière plus intelligente, au lieu de simplement investir davantage dans du matériel ?
Actuellement, le coût de l'entraînement des grands modèles d'IA de pointe est extrêmement élevé. Certaines entreprises d'IA de premier plan dépensent plus de 100 millions de dollars uniquement pour le calcul, nécessitant des centres de données de grande taille équipés de milliers de GPU d'une valeur de 40 000 dollars chacun. Cependant, DeepSeek a proposé une solution surprenante : réaliser cette tâche pour 5 millions de dollars. Plus étonnant encore, ils n'ont pas seulement proposé cette idée, mais l'ont réellement mise en œuvre. Leur modèle est comparable ou même meilleur que les systèmes d'IA de pointe dans de nombreuses tâches.
Le succès de DeepSeek provient de leur réflexion sur tout à partir de zéro. Les modèles d'IA traditionnels utilisent des décimales de 32 bits pour représenter chaque chiffre, tandis que DeepSeek essaie d'utiliser des décimales de 8 bits, découvrant que la précision est encore suffisante. Ce changement a réduit la mémoire requise de 75 %. En conséquence, le coût de formation est passé de 100 millions de dollars à 5 millions de dollars, le nombre de GPU nécessaires est passé de 100 000 à 2 000, et le coût des API a baissé de 95 %. Plus important encore, leur modèle peut fonctionner sur des GPU de jeu ordinaires, sans matériel de centre de données spécialisé.
Le succès de DeepSeek remet en question plusieurs idées traditionnelles dans le domaine de l'IA, y compris l'idée que la Chine ne peut produire que des codes source fermés, que la Silicon Valley est en position de leader absolu dans le domaine de l'IA, et que le développement de modèles d'IA de pointe nécessite des investissements colossaux. Ces idées, même si elles n'ont pas été complètement renversées, ont été sérieusement ébranlées.
Une célèbre institution américaine de capital-investissement a déclaré dans son rapport que DeepSeek représente une victoire de l'open source par rapport au closed source. Les contributions de la communauté open source peuvent rapidement se traduire par la prospérité de l'ensemble de l'écosystème. Par ailleurs, ils estiment que bien que le chemin de développement des entreprises d'IA traditionnelles semble simple et brut, il n'est pas exclu qu'une nouvelle mutation apparaisse après avoir atteint une certaine échelle. D'après l'histoire du développement de l'IA au cours des 70 dernières années, la puissance de calcul demeure cruciale, et cela pourrait continuer à s'appliquer à l'avenir.
L'apparition de DeepSeek a permis aux modèles open source d'atteindre un niveau comparable à celui des modèles fermés, voire d'être plus efficaces. Cela réduit la nécessité pour les entreprises d'acheter des API commerciales d'IA, offrant ainsi un plus grand espace de développement pour les applications en aval. On s'attend à ce qu'au cours des une à deux prochaines années, nous soyons témoins de produits de puces de raisonnement plus riches et d'un écosystème d'applications de grands modèles linguistiques plus prospère.
Bien que DeepSeek ait montré une efficacité très élevée, les experts estiment que la demande de puissance de calcul ne diminuera pas. Cela correspond au paradoxe de Jevons en économie, selon lequel l'amélioration de l'efficacité technologique entraîne en fait une augmentation de la consommation globale des ressources. Tout comme dans le processus de généralisation du passage du téléphone mobile à l'usage courant de Nokia, c'est justement grâce à la baisse des coûts que la généralisation a été réalisée, et cette généralisation a entraîné une augmentation de la consommation totale sur le marché.
Cette percée majeure dans la technologie de l'IA aura sans aucun doute un impact profond sur le paysage technologique mondial, tout en offrant de nouvelles perspectives pour l'avenir du développement de l'IA. Avec l'évolution constante de la technologie, nous espérons voir davantage d'innovations et de percées qui propulseront le domaine de l'IA vers une direction plus efficace et plus répandue.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
14 J'aime
Récompense
14
7
Partager
Commentaire
0/400
ContractFreelancer
· Il y a 8h
GPT cette fois-ci est condamné
Voir l'originalRépondre0
LuckyBlindCat
· Il y a 8h
Touché les points sensibles des grandes entreprises.
Voir l'originalRépondre0
WhaleStalker
· Il y a 8h
Open Source est le vrai chemin !
Voir l'originalRépondre0
BankruptcyArtist
· Il y a 8h
Encore un qui cherche à profiter de la notoriété.
Voir l'originalRépondre0
LightningLady
· Il y a 8h
Je ne le crois pas du tout.
Voir l'originalRépondre0
BlockchainDecoder
· Il y a 8h
D'un point de vue théorique de l'architecture AI, le point de rupture de DeepSeek réside dans l'optimisation des algorithmes sous-jacents, en se référant aux données des articles de la conférence AAAI 2023.
DeepSeek franchit les barrières technologiques de l'IA, provoquant des turbulences sur le marché boursier américain.
La vague d'IA déferle sur le monde, DeepSeek émerge avec force et provoque des secousses sur le marché
Récemment, un événement marquant s'est produit dans le domaine de l'IA. Un modèle d'IA chinois nommé DeepSeek a dépassé pour la première fois ChatGPT en termes de téléchargements sur l'App Store américain, atteignant la première place. Ce phénomène a non seulement suscité un large intérêt dans le monde de la technologie, des investissements et des médias, mais a également provoqué une brève panique sur le marché des capitaux américains.
En conséquence, les actions de plusieurs géants de la technologie ont chuté à des degrés divers. Nvidia a enregistré une baisse de 5,3 %, ARM de 5,5 %, Broadcom de 4,9 % et TSMC de 4,5 %. D'autres sociétés comme Micron, AMD et Intel ont également connu des baisses correspondantes. Les contrats à terme du Nasdaq 100 ont chuté de -400 points, s'apprêtant à enregistrer la plus forte baisse en une seule journée depuis le 18 décembre. Selon des statistiques incomplètes, la capitalisation boursière américaine pourrait avoir disparu de plus de 1 000 milliards de dollars lors des transactions de lundi, ce qui équivaut à un tiers de la capitalisation totale du marché de la cryptographie.
Le marché des cryptomonnaies n'a également pas échappé à cette tendance baissière. Le prix du Bitcoin est tombé en dessous de 100500 dollars, avec une baisse de 4,48 % sur 24 heures. L'Ethereum est tombé en dessous de 3200 dollars, avec une baisse de 3,83 % sur 24 heures. De nombreux investisseurs sont perplexes face à cette volatilité soudaine du marché, certains pensant que cela pourrait être lié à une réduction des attentes de taux d'intérêt de la Réserve fédérale ou à d'autres facteurs macroéconomiques.
L'essor de DeepSeek a suscité une nouvelle réflexion sur les modèles de développement de l'IA. Contrairement à des entreprises comme OpenAI ou Meta, DeepSeek ne s'est pas développé grâce à un capital solide et à de nombreuses ressources matérielles. En comparaison, OpenAI a été fondée il y a 10 ans, compte 4500 employés et a levé 6,6 milliards de dollars. Une certaine entreprise de médias sociaux a même dépensé 60 milliards de dollars pour développer un centre de données IA de la taille de Manhattan. DeepSeek, quant à elle, a été fondée depuis moins de 2 ans, compte seulement 200 employés, a un coût de développement de moins de 10 millions de dollars et n'a pas acheté de GPU haut de gamme en grande quantité.
Ce contraste pousse les professionnels du secteur à se demander : comment les géants technologiques traditionnels peuvent-ils rivaliser avec DeepSeek ? Le succès de DeepSeek reflète non seulement un avantage en termes de coûts sur le plan du capital et de la technologie, mais il remet également en question les idées préconçues sur le développement de l'IA.
Le vice-président des produits d'une entreprise technologique bien connue a commenté sur les réseaux sociaux que l'histoire de DeepSeek illustre un exemple typique d'innovation disruptive. Les entreprises existantes optimisent leurs processus actuels, tandis que les perturbateurs repensent les méthodes fondamentales. DeepSeek propose une nouvelle approche : que se passerait-il si nous faisions cela de manière plus intelligente, au lieu de simplement investir davantage dans du matériel ?
Actuellement, le coût de l'entraînement des grands modèles d'IA de pointe est extrêmement élevé. Certaines entreprises d'IA de premier plan dépensent plus de 100 millions de dollars uniquement pour le calcul, nécessitant des centres de données de grande taille équipés de milliers de GPU d'une valeur de 40 000 dollars chacun. Cependant, DeepSeek a proposé une solution surprenante : réaliser cette tâche pour 5 millions de dollars. Plus étonnant encore, ils n'ont pas seulement proposé cette idée, mais l'ont réellement mise en œuvre. Leur modèle est comparable ou même meilleur que les systèmes d'IA de pointe dans de nombreuses tâches.
Le succès de DeepSeek provient de leur réflexion sur tout à partir de zéro. Les modèles d'IA traditionnels utilisent des décimales de 32 bits pour représenter chaque chiffre, tandis que DeepSeek essaie d'utiliser des décimales de 8 bits, découvrant que la précision est encore suffisante. Ce changement a réduit la mémoire requise de 75 %. En conséquence, le coût de formation est passé de 100 millions de dollars à 5 millions de dollars, le nombre de GPU nécessaires est passé de 100 000 à 2 000, et le coût des API a baissé de 95 %. Plus important encore, leur modèle peut fonctionner sur des GPU de jeu ordinaires, sans matériel de centre de données spécialisé.
Le succès de DeepSeek remet en question plusieurs idées traditionnelles dans le domaine de l'IA, y compris l'idée que la Chine ne peut produire que des codes source fermés, que la Silicon Valley est en position de leader absolu dans le domaine de l'IA, et que le développement de modèles d'IA de pointe nécessite des investissements colossaux. Ces idées, même si elles n'ont pas été complètement renversées, ont été sérieusement ébranlées.
Une célèbre institution américaine de capital-investissement a déclaré dans son rapport que DeepSeek représente une victoire de l'open source par rapport au closed source. Les contributions de la communauté open source peuvent rapidement se traduire par la prospérité de l'ensemble de l'écosystème. Par ailleurs, ils estiment que bien que le chemin de développement des entreprises d'IA traditionnelles semble simple et brut, il n'est pas exclu qu'une nouvelle mutation apparaisse après avoir atteint une certaine échelle. D'après l'histoire du développement de l'IA au cours des 70 dernières années, la puissance de calcul demeure cruciale, et cela pourrait continuer à s'appliquer à l'avenir.
L'apparition de DeepSeek a permis aux modèles open source d'atteindre un niveau comparable à celui des modèles fermés, voire d'être plus efficaces. Cela réduit la nécessité pour les entreprises d'acheter des API commerciales d'IA, offrant ainsi un plus grand espace de développement pour les applications en aval. On s'attend à ce qu'au cours des une à deux prochaines années, nous soyons témoins de produits de puces de raisonnement plus riches et d'un écosystème d'applications de grands modèles linguistiques plus prospère.
Bien que DeepSeek ait montré une efficacité très élevée, les experts estiment que la demande de puissance de calcul ne diminuera pas. Cela correspond au paradoxe de Jevons en économie, selon lequel l'amélioration de l'efficacité technologique entraîne en fait une augmentation de la consommation globale des ressources. Tout comme dans le processus de généralisation du passage du téléphone mobile à l'usage courant de Nokia, c'est justement grâce à la baisse des coûts que la généralisation a été réalisée, et cette généralisation a entraîné une augmentation de la consommation totale sur le marché.
Cette percée majeure dans la technologie de l'IA aura sans aucun doute un impact profond sur le paysage technologique mondial, tout en offrant de nouvelles perspectives pour l'avenir du développement de l'IA. Avec l'évolution constante de la technologie, nous espérons voir davantage d'innovations et de percées qui propulseront le domaine de l'IA vers une direction plus efficace et plus répandue.