A onda de redução de preços dos grandes modelos chegou, Tongyi Qianwen lidera a transformação da indústria
Recentemente, a Alibaba Cloud anunciou uma redução significativa nos preços de chamada da API do seu modelo de comercialização Tongyi Qwen. O preço de entrada do modelo Qwen-Long caiu de 0,02 yuan por mil tokens para 0,5 yuan por milhão de tokens, uma redução de até 97%. Esta medida marca a chegada da onda de redução de preços na indústria de grandes modelos.
Anteriormente, a Alibaba Tongyi lançou o modelo de código aberto Qwen1.5-110B com 110 bilhões de parâmetros. Este modelo teve um desempenho excepcional em várias avaliações de referência, superando o modelo Llama-3-70B da Meta, e ocupa o primeiro lugar no ranking de grandes modelos de código aberto da HuggingFace.
"Redução de preço + código aberto" está gradualmente se tornando um consenso entre os fabricantes de grandes modelos globais. Isso ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, promovendo assim o desenvolvimento abrangente de aplicações de IA.
Na verdade, o Tongyi Qianwen não é o primeiro grande modelo a reduzir preços para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos a preços baixos ou realizaram reduções de preços:
A DeepSeek da Huanfang Quantitative lançou o modelo MoE de segunda geração open-source, com preços de API que são apenas cerca de um por cento de um modelo conhecido.
Uma empresa de IA reduziu o preço de chamada do seu modelo pessoal de 5 yuan por milhão de tokens para 1 yuan.
Uma empresa de IA de renome internacional lançou uma nova versão do modelo, que mantém o desempenho enquanto a velocidade de chamada da API aumentou para o dobro e o preço foi reduzido pela metade.
O preço de entrada para a inferência do modelo principal de uma empresa de tecnologia nacional é apenas 0.0008 yuan por k Tokens.
Uma grande empresa de tecnologia anunciou que os seus dois principais modelos estarão totalmente abertos e gratuitos.
Uma empresa de IA anunciou que a sua API Lite estará disponível gratuitamente para sempre.
Esta onda de queda de preços pode ser originada pelos avanços na tecnologia de inferência de grandes modelos e pela redução de custos, o que objetivamente oferece mais opções aos desenvolvedores, favorecendo o desenvolvimento de aplicações de IA.
Além da redução de preços, a Alibaba Tongyi lançou vários modelos de linguagem de diferentes escalas para atender às necessidades de diferentes cenários. O modelo pequeno (0.5B-14B) pode ser implantado em dispositivos móveis; o modelo grande (72B-110B) suporta aplicações de nível empresarial e de pesquisa; o modelo médio (32B) busca um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de modelos multimodais, como os de visão, áudio e código. Essas iniciativas irão apoiar cenários de aplicação de IA diversificados.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
8 gostos
Recompensa
8
5
Partilhar
Comentar
0/400
MintMaster
· 10h atrás
Estou à espera da era de modelagem gratuita.
Ver originalResponder0
PortfolioAlert
· 10h atrás
Explodiu, explodiu. Será que conseguimos suportar uma queda tão grande?
A queda de preço de 97% do Tongyi Qianwen provoca uma onda de redução de preços na indústria de modelos grandes.
A onda de redução de preços dos grandes modelos chegou, Tongyi Qianwen lidera a transformação da indústria
Recentemente, a Alibaba Cloud anunciou uma redução significativa nos preços de chamada da API do seu modelo de comercialização Tongyi Qwen. O preço de entrada do modelo Qwen-Long caiu de 0,02 yuan por mil tokens para 0,5 yuan por milhão de tokens, uma redução de até 97%. Esta medida marca a chegada da onda de redução de preços na indústria de grandes modelos.
Anteriormente, a Alibaba Tongyi lançou o modelo de código aberto Qwen1.5-110B com 110 bilhões de parâmetros. Este modelo teve um desempenho excepcional em várias avaliações de referência, superando o modelo Llama-3-70B da Meta, e ocupa o primeiro lugar no ranking de grandes modelos de código aberto da HuggingFace.
"Redução de preço + código aberto" está gradualmente se tornando um consenso entre os fabricantes de grandes modelos globais. Isso ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, promovendo assim o desenvolvimento abrangente de aplicações de IA.
Na verdade, o Tongyi Qianwen não é o primeiro grande modelo a reduzir preços para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos a preços baixos ou realizaram reduções de preços:
A DeepSeek da Huanfang Quantitative lançou o modelo MoE de segunda geração open-source, com preços de API que são apenas cerca de um por cento de um modelo conhecido.
Uma empresa de IA reduziu o preço de chamada do seu modelo pessoal de 5 yuan por milhão de tokens para 1 yuan.
Uma empresa de IA de renome internacional lançou uma nova versão do modelo, que mantém o desempenho enquanto a velocidade de chamada da API aumentou para o dobro e o preço foi reduzido pela metade.
O preço de entrada para a inferência do modelo principal de uma empresa de tecnologia nacional é apenas 0.0008 yuan por k Tokens.
Uma grande empresa de tecnologia anunciou que os seus dois principais modelos estarão totalmente abertos e gratuitos.
Uma empresa de IA anunciou que a sua API Lite estará disponível gratuitamente para sempre.
Esta onda de queda de preços pode ser originada pelos avanços na tecnologia de inferência de grandes modelos e pela redução de custos, o que objetivamente oferece mais opções aos desenvolvedores, favorecendo o desenvolvimento de aplicações de IA.
Além da redução de preços, a Alibaba Tongyi lançou vários modelos de linguagem de diferentes escalas para atender às necessidades de diferentes cenários. O modelo pequeno (0.5B-14B) pode ser implantado em dispositivos móveis; o modelo grande (72B-110B) suporta aplicações de nível empresarial e de pesquisa; o modelo médio (32B) busca um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de modelos multimodais, como os de visão, áudio e código. Essas iniciativas irão apoiar cenários de aplicação de IA diversificados.