Le serveur Lenovo AI réalise pour la première fois un déploiement local du modèle DeepSeek à pleine capacité avec moins de 1 To, prenant en charge 100 connexions simultanées.

Les données Jinshi du 3 mars ont récemment annoncé que le groupe Lenovo a annoncé la première mise en œuvre dans l'industrie du déploiement en solo du grand modèle DeepSeek-R1/V3 671B sur le serveur Lenovo Wentai WA7780 G3, avec une mémoire vidéo inférieure à 1 TGB reconnue par l'industrie (réellement 768 Go) pour offrir une expérience fluide à 100 utilisateurs simultanés. Selon les données de test de Lenovo, dans un environnement de test standard à 512 tokens, ce système peut prendre en charge 100 utilisateurs simultanés pour une sortie stable de 10 tokens par seconde, avec un temps de réponse token initial réduit à moins de 30 secondes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 1
  • Partager
Commentaire
0/400
Andruchovip
· 03-03 05:30
l'auteur est génial !!!
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)