La reducción de precio del 97% de Tongyi Qianwen ha provocado una ola de recortes de precios en la industria de los modelos grandes.

robot
Generación de resúmenes en curso

La llegada de la ola de reducción de precios de grandes modelos, Tongyi Qianwen lidera la transformación de la industria

Recientemente, Alibaba Cloud anunció una drástica reducción en los precios de llamadas a la API de su modelo comercial Tongyi Qwen. En este sentido, el precio de entrada del modelo Qwen-Long se redujo de 0.02 yuanes por cada mil tokens a 0.5 yuanes por cada millón de tokens, una disminución del 97%. Esta medida marca la llegada de una ola de reducción de precios en la industria de modelos grandes.

Anteriormente, Alibaba Tongyi lanzó el modelo de código abierto Qwen1.5-110B con una cantidad de parámetros de 1100 millones. Este modelo se destacó en múltiples evaluaciones de referencia, superando al modelo Llama-3-70B de Meta, y ocupó el primer lugar en la lista de modelos grandes de código abierto de HuggingFace.

"Bajar precios + código abierto" se está convirtiendo gradualmente en el consenso de los fabricantes de modelos grandes en todo el mundo. Esto ayuda a resolver dos grandes problemas que enfrentan los desarrolladores de aplicaciones de IA: el alto costo de las API de modelos grandes y la calidad insuficiente de los modelos de código abierto, lo que impulsa el desarrollo integral de las aplicaciones de IA.

De hecho, Tongyi Qianwen no es el primer modelo grande que reduce precios para los desarrolladores. Desde mayo, varias empresas de modelos grandes han lanzado productos a bajo precio o han reducido precios:

  • La segunda generación del modelo MoE de DeepSeek(, bajo el paraguas de Huanfang Quantification, es de código abierto y el precio de la API es solo alrededor del uno por ciento de un modelo conocido.

  • Una empresa de IA ha reducido el precio de llamada de su modelo personal de 5 yuanes por cada millón de tokens a 1 yuan.

  • Una conocida empresa de IA internacional ha lanzado un nuevo modelo, manteniendo el rendimiento mientras que la velocidad de llamada a la API se ha duplicado y el precio se ha reducido a la mitad.

  • El precio de entrada para la inferencia del modelo principal de una empresa de tecnología nacional es de solo 0.0008 yuanes por cada k Tokens.

  • Una gran empresa de tecnología anunció que sus dos modelos principales estarán completamente disponibles de forma gratuita.

  • Una empresa de IA anunció que su API Lite estará disponible de forma gratuita para siempre.

Esta ola de reducción de precios puede deberse a los avances en la tecnología de inferencia de grandes modelos y la disminución de costos, lo que objetivamente ofrece más opciones a los desarrolladores y favorece el desarrollo de aplicaciones de IA.

Además de reducir precios, Ali Tongyi también ha lanzado varios modelos de lenguaje de diferentes tamaños para satisfacer las necesidades de diferentes escenarios. Los modelos pequeños )0.5B-14B( se pueden implementar en dispositivos móviles; los modelos grandes )72B-110B( apoyan aplicaciones de nivel empresarial y de investigación; los modelos medianos )32B( buscan un equilibrio entre rendimiento, eficiencia y uso de memoria. Además, Tongyi también ha abierto el código de modelos multimodales como visuales, de audio y de código. Estas iniciativas brindarán apoyo a una variedad de escenarios de aplicaciones de IA.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
MintMastervip
· hace7h
Estoy esperando la era en la que se pueda obtener el modelo gratis.
Ver originalesResponder0
PortfolioAlertvip
· hace7h
¡Explosión! ¿Puede soportarse una caída tan grande?
Ver originalesResponder0
NotAFinancialAdvicevip
· hace7h
Bajar el precio y ya está.
Ver originalesResponder0
ponzi_poetvip
· hace7h
No sirve de nada bajar, bajar y bajar.
Ver originalesResponder0
HashBardvip
· hace7h
se siente como si el invierno de la IA se estuviera calentando, ¿eh?
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)