L'entraînement des grands modèles d'IA rencontre des obstacles, la Puissance de calcul insuffisante entraîne des difficultés pour l'industrie et des réponses.
Puissance de calcul en pénurie : les défis et réponses de l'entraînement des grands modèles
La formation de grands modèles est en plein essor, mais la pénurie de GPU haut de gamme est devenue un grand défi auquel l'industrie est confrontée. Malgré la hausse constante des prix, le loyer mensuel d'un GPU de premier ordre atteint désormais 50 000 à 70 000 yuans, mais il est toujours difficile d'en trouver un. Cette situation de pénurie devrait être difficile à résoudre à court terme, et les grandes entreprises calculent combien de "marchandises" elles ont en main.
Cependant, le seuil d'entrée pour l'entraînement de grands modèles n'est pas aussi simple que d'obtenir un GPU. Prenons l'exemple d'un grand modèle météorologique, dont le coût d'entraînement dépasse 2 millions de yuans. Pour un grand modèle généraliste, il est difficile de continuer sans un investissement de plusieurs milliards. Certains entrepreneurs décrivent la concurrence actuelle dans le domaine des grands modèles comme un "brûlage d'argent" ; sans un soutien financier solide, il est difficile de persister.
Face à cette situation difficile, les entreprises recherchent activement des solutions. Parmi les méthodes, on trouve : utiliser des données de meilleure qualité pour améliorer l'efficacité de l'entraînement ; améliorer les capacités d'infrastructure pour garantir un fonctionnement stable à long terme ; optimiser la Puissance de calcul pour augmenter le taux d'utilisation ; adopter une architecture de supercalculateur en remplacement de l'architecture de cloud computing, etc. D'autres entreprises choisissent d'utiliser des plateformes nationales pour l'entraînement et l'inférence de grands modèles, afin de remplacer les GPU importés en pénurie.
En fait, la puissance de calcul est en train de devenir un nouveau modèle de service. Le service de puissance de calcul est basé sur une puissance de calcul diversifiée, reliée par un réseau de puissance de calcul, avec pour objectif de fournir une puissance de calcul efficace. Il comprend non seulement la puissance de calcul, mais englobe également l'emballage unifié de ressources telles que le stockage et le réseau. Dans cette chaîne de valeur, les entreprises en amont fournissent des ressources de puissance de calcul de base, les entreprises en milieu de chaîne sont responsables de la production et de l'approvisionnement en puissance de calcul, tandis que les utilisateurs industriels en aval s'appuient sur les services de puissance de calcul pour créer de la valeur ajoutée.
Avec la normalisation de la demande en calcul haute performance pour les grands modèles, les services de puissance de calcul se développent rapidement pour devenir une chaîne industrielle et un modèle commercial uniques. Bien que le problème de la pénurie de GPU haut de gamme et des coûts élevés persiste actuellement, à long terme, la service de puissance de calcul est une tendance certaine. Les fournisseurs de services de puissance de calcul doivent anticiper et se préparer aux changements du marché.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
9 J'aime
Récompense
9
4
Partager
Commentaire
0/400
TooScaredToSell
· 08-06 10:11
Pas de force, cours vite, brûle de l'argent.
Voir l'originalRépondre0
CompoundPersonality
· 08-06 10:09
J'ai vendu mes GPU, je me retire.
Voir l'originalRépondre0
RektButSmiling
· 08-06 10:06
Le joueur de carte explosée est de nouveau présent.
L'entraînement des grands modèles d'IA rencontre des obstacles, la Puissance de calcul insuffisante entraîne des difficultés pour l'industrie et des réponses.
Puissance de calcul en pénurie : les défis et réponses de l'entraînement des grands modèles
La formation de grands modèles est en plein essor, mais la pénurie de GPU haut de gamme est devenue un grand défi auquel l'industrie est confrontée. Malgré la hausse constante des prix, le loyer mensuel d'un GPU de premier ordre atteint désormais 50 000 à 70 000 yuans, mais il est toujours difficile d'en trouver un. Cette situation de pénurie devrait être difficile à résoudre à court terme, et les grandes entreprises calculent combien de "marchandises" elles ont en main.
Cependant, le seuil d'entrée pour l'entraînement de grands modèles n'est pas aussi simple que d'obtenir un GPU. Prenons l'exemple d'un grand modèle météorologique, dont le coût d'entraînement dépasse 2 millions de yuans. Pour un grand modèle généraliste, il est difficile de continuer sans un investissement de plusieurs milliards. Certains entrepreneurs décrivent la concurrence actuelle dans le domaine des grands modèles comme un "brûlage d'argent" ; sans un soutien financier solide, il est difficile de persister.
Face à cette situation difficile, les entreprises recherchent activement des solutions. Parmi les méthodes, on trouve : utiliser des données de meilleure qualité pour améliorer l'efficacité de l'entraînement ; améliorer les capacités d'infrastructure pour garantir un fonctionnement stable à long terme ; optimiser la Puissance de calcul pour augmenter le taux d'utilisation ; adopter une architecture de supercalculateur en remplacement de l'architecture de cloud computing, etc. D'autres entreprises choisissent d'utiliser des plateformes nationales pour l'entraînement et l'inférence de grands modèles, afin de remplacer les GPU importés en pénurie.
En fait, la puissance de calcul est en train de devenir un nouveau modèle de service. Le service de puissance de calcul est basé sur une puissance de calcul diversifiée, reliée par un réseau de puissance de calcul, avec pour objectif de fournir une puissance de calcul efficace. Il comprend non seulement la puissance de calcul, mais englobe également l'emballage unifié de ressources telles que le stockage et le réseau. Dans cette chaîne de valeur, les entreprises en amont fournissent des ressources de puissance de calcul de base, les entreprises en milieu de chaîne sont responsables de la production et de l'approvisionnement en puissance de calcul, tandis que les utilisateurs industriels en aval s'appuient sur les services de puissance de calcul pour créer de la valeur ajoutée.
Avec la normalisation de la demande en calcul haute performance pour les grands modèles, les services de puissance de calcul se développent rapidement pour devenir une chaîne industrielle et un modèle commercial uniques. Bien que le problème de la pénurie de GPU haut de gamme et des coûts élevés persiste actuellement, à long terme, la service de puissance de calcul est une tendance certaine. Les fournisseurs de services de puissance de calcul doivent anticiper et se préparer aux changements du marché.