A queda de preço de 97% do Tongyi Qianwen provoca uma onda de redução de preços na indústria de modelos grandes.

robot
Geração de resumo em curso

A onda de redução de preços dos grandes modelos chegou, Tongyi Qianwen lidera a transformação da indústria

Recentemente, a Alibaba Cloud anunciou uma redução significativa nos preços de chamada da API do seu modelo de comercialização Tongyi Qwen. O preço de entrada do modelo Qwen-Long caiu de 0,02 yuan por mil tokens para 0,5 yuan por milhão de tokens, uma redução de até 97%. Esta medida marca a chegada da onda de redução de preços na indústria de grandes modelos.

Anteriormente, a Alibaba Tongyi lançou o modelo de código aberto Qwen1.5-110B com 110 bilhões de parâmetros. Este modelo teve um desempenho excepcional em várias avaliações de referência, superando o modelo Llama-3-70B da Meta, e ocupa o primeiro lugar no ranking de grandes modelos de código aberto da HuggingFace.

"Redução de preço + código aberto" está gradualmente se tornando um consenso entre os fabricantes de grandes modelos globais. Isso ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, promovendo assim o desenvolvimento abrangente de aplicações de IA.

Na verdade, o Tongyi Qianwen não é o primeiro grande modelo a reduzir preços para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos a preços baixos ou realizaram reduções de preços:

  • A DeepSeek da Huanfang Quantitative lançou o modelo MoE de segunda geração open-source, com preços de API que são apenas cerca de um por cento de um modelo conhecido.

  • Uma empresa de IA reduziu o preço de chamada do seu modelo pessoal de 5 yuan por milhão de tokens para 1 yuan.

  • Uma empresa de IA de renome internacional lançou uma nova versão do modelo, que mantém o desempenho enquanto a velocidade de chamada da API aumentou para o dobro e o preço foi reduzido pela metade.

  • O preço de entrada para a inferência do modelo principal de uma empresa de tecnologia nacional é apenas 0.0008 yuan por k Tokens.

  • Uma grande empresa de tecnologia anunciou que os seus dois principais modelos estarão totalmente abertos e gratuitos.

  • Uma empresa de IA anunciou que a sua API Lite estará disponível gratuitamente para sempre.

Esta onda de queda de preços pode ser originada pelos avanços na tecnologia de inferência de grandes modelos e pela redução de custos, o que objetivamente oferece mais opções aos desenvolvedores, favorecendo o desenvolvimento de aplicações de IA.

Além da redução de preços, a Alibaba Tongyi lançou vários modelos de linguagem de diferentes escalas para atender às necessidades de diferentes cenários. O modelo pequeno (0.5B-14B) pode ser implantado em dispositivos móveis; o modelo grande (72B-110B) suporta aplicações de nível empresarial e de pesquisa; o modelo médio (32B) busca um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de modelos multimodais, como os de visão, áudio e código. Essas iniciativas irão apoiar cenários de aplicação de IA diversificados.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 5
  • Partilhar
Comentar
0/400
MintMastervip
· 10h atrás
Estou à espera da era de modelagem gratuita.
Ver originalResponder0
PortfolioAlertvip
· 10h atrás
Explodiu, explodiu. Será que conseguimos suportar uma queda tão grande?
Ver originalResponder0
NotAFinancialAdvicevip
· 10h atrás
É só baixar o preço.
Ver originalResponder0
ponzi_poetvip
· 10h atrás
Diminuir, diminuir, diminuir, não adianta.
Ver originalResponder0
HashBardvip
· 10h atrás
parece que o inverno da IA está a aquecer, não é?
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)