Le modèle Tongyi Qianwen a connu une baisse de prix de 97 %, déclenchant une vague de baisses de prix dans l'industrie des grands modèles.

robot
Création du résumé en cours

La vague de baisse des prix des grands modèles arrive, Tongyi Qianwen mène la transformation de l'industrie

Récemment, Alibaba Cloud a annoncé une réduction significative des prix d'appel d'API de son modèle commercial Tongyi Qwen. Ainsi, le prix d'entrée du modèle Qwen-Long est passé de 0,02 yuan par k tokens à 0,5 yuan par million de tokens, avec une baisse allant jusqu'à 97 %. Cette initiative marque l'arrivée d'une tendance à la baisse des prix dans l'industrie des grands modèles.

Précédemment, Ali Tongyi a publié le modèle open source Qwen1.5-110B avec un nombre de paramètres atteignant 110 milliards. Ce modèle a excellé dans plusieurs évaluations de référence, surpassant le modèle Llama-3-70B de Meta, et se classe au premier rang du classement des grands modèles open source de HuggingFace.

"Baisse de prix + open source" devient progressivement un consensus parmi les fabricants de grands modèles dans le monde. Cela aide à résoudre les deux principaux problèmes auxquels sont confrontés les développeurs d'applications IA : le coût élevé des API de grands modèles et la qualité insuffisante des modèles open source, favorisant ainsi le développement complet des applications IA.

En fait, Tongyi Qianwen n'est pas le premier grand modèle à réduire les prix pour les développeurs. Depuis mai, plusieurs fabricants de grands modèles ont lancé des produits à bas prix ou ont réduit leurs prix :

  • Sous la marque DeepSeek de Huanfang Quantification, le modèle MoE de deuxième génération, open source, est proposé avec un tarif API d'environ un pour cent d'un modèle connu.

  • Une société d'IA a réduit le prix d'appel de son modèle personnel de 5元 par million de tokens à 1元.

  • Une entreprise d'IA internationale bien connue a lancé un nouveau modèle, augmentant la vitesse d'appel de l'API tout en maintenant les performances, et réduisant le prix de moitié.

  • Le prix d'entrée pour l'inférence du modèle principal d'une entreprise technologique nationale n'est que de 0,0008 yuan par k Tokens.

  • Une grande entreprise technologique a annoncé que ses deux principaux modèles de grande taille seraient entièrement ouverts et gratuits.

  • Une entreprise d'IA a annoncé que sa version Lite de l'API serait gratuite à vie.

Cette vague de baisse des prix pourrait être due aux avancées dans la technologie d'inférence des grands modèles et à la réduction des coûts, offrant objectivement plus de choix aux développeurs et favorisant le développement des applications AI.

En plus de la réduction des prix, Alibaba Tongyi a également lancé plusieurs modèles de langage de différentes tailles pour répondre aux besoins de divers scénarios. Le modèle de petite taille (0.5B-14B) peut être déployé sur des appareils mobiles ; le modèle de grande taille (72B-110B) prend en charge des applications de niveau entreprise et de recherche ; le modèle de taille moyenne (32B) recherche un équilibre entre performance, efficacité et utilisation de la mémoire. De plus, Tongyi a également open source des modèles multimodaux pour la vision, l'audio, le code, etc. Ces initiatives soutiendront une diversité de scénarios d'application IA.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
MintMastervip
· Il y a 8h
J'attends l'ère du modèle gratuit.
Voir l'originalRépondre0
PortfolioAlertvip
· Il y a 9h
Ça explose, ça explose. Est-ce que c'est supportable de baisser autant?
Voir l'originalRépondre0
NotAFinancialAdvicevip
· Il y a 9h
C'est tout ce qu'il faut pour baisser le prix.
Voir l'originalRépondre0
ponzi_poetvip
· Il y a 9h
Baisser baisser baisser n'est d'aucune utilité.
Voir l'originalRépondre0
HashBardvip
· Il y a 9h
on dirait que l'hiver de l'IA devient plus chaud, hein
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)