Gelombang penurunan harga model besar datang, Tongyi Qianwen memimpin perubahan industri
Baru-baru ini, Alibaba Cloud mengumumkan penurunan drastis harga panggilan API untuk model komersialisasi Tongyi Qwen. Di antara mereka, harga input model Qwen-Long turun dari 0,02 yuan per seribu tokens menjadi 0,5 yuan per satu juta tokens, dengan penurunan mencapai 97%. Langkah ini menandai datangnya gelombang penurunan harga di industri model besar.
Sebelumnya, Ali Tongyi merilis model sumber terbuka Qwen1.5-110B dengan jumlah parameter mencapai 1100 k. Model ini menunjukkan kinerja yang sangat baik dalam berbagai pengujian tolok ukur, melampaui model Meta Llama-3-70B, dan menduduki peringkat teratas di papan peringkat model besar sumber terbuka HuggingFace.
"Penurunan harga + sumber terbuka" secara bertahap menjadi konsensus di kalangan produsen model besar global. Ini membantu mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi dan kualitas model sumber terbuka yang kurang, sehingga mendorong perkembangan aplikasi AI secara menyeluruh.
Faktanya, Tongyi Qianwen bukanlah model besar pertama yang menurunkan harga untuk pengembang. Sejak bulan Mei, banyak perusahaan model besar telah meluncurkan produk dengan harga rendah atau melakukan penurunan harga:
DeepSeek di bawah Huanfang Quantitative melakukan penelitian mendalam (Model MoE generasi kedua sumber terbuka, harga API hanya sekitar satu persen dari model terkenal.
Sebuah perusahaan AI menurunkan harga panggilan model versi pribadi mereka dari 5 yuan per juta tokens menjadi 1 yuan.
Sebuah perusahaan AI internasional terkenal meluncurkan model versi baru, yang meningkatkan kecepatan panggilan API dua kali lipat sambil mempertahankan kinerjanya, dan harganya dipotong setengah.
Penetapan harga input model inferensi utama dari suatu perusahaan teknologi domestik hanya sebesar 0,0008 yuan per kTokens.
Sebuah perusahaan teknologi besar mengumumkan bahwa dua model utama mereka akan dibuka secara gratis.
Sebuah perusahaan AI mengumumkan bahwa API Lite mereka akan tersedia secara gratis selamanya.
Gelombang penurunan harga ini mungkin berasal dari kemajuan teknologi inferensi model besar dan penurunan biaya, secara objektif memberikan lebih banyak pilihan kepada pengembang, yang menguntungkan pengembangan aplikasi AI.
Selain penurunan harga, Ali Tongyi juga meluncurkan berbagai ukuran model bahasa besar untuk memenuhi kebutuhan berbagai skenario. Model kecil )0.5B-14B( dapat diterapkan di perangkat seluler; model besar )72B-110B( mendukung aplikasi tingkat perusahaan dan penelitian; model menengah )32B( mencari keseimbangan antara kinerja, efisiensi, dan penggunaan memori. Selain itu, Tongyi juga telah mengopen-source model multimodal seperti visual, audio, dan kode. Langkah-langkah ini akan mendukung beragam skenario aplikasi AI.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
8 Suka
Hadiah
8
5
Bagikan
Komentar
0/400
MintMaster
· 3jam yang lalu
Saya menunggu era model gratis
Lihat AsliBalas0
PortfolioAlert
· 3jam yang lalu
Meledak, meledak, apakah bisa bertahan dengan penurunan sebanyak ini?
Lihat AsliBalas0
NotAFinancialAdvice
· 3jam yang lalu
Turunkan harga saja.
Lihat AsliBalas0
ponzi_poet
· 3jam yang lalu
Turunkan, turunkan, turunkan, tetap tidak ada gunanya.
Tongyi Qianwen mengalami penurunan harga sebesar 97% yang memicu gelombang penurunan harga di industri model besar.
Gelombang penurunan harga model besar datang, Tongyi Qianwen memimpin perubahan industri
Baru-baru ini, Alibaba Cloud mengumumkan penurunan drastis harga panggilan API untuk model komersialisasi Tongyi Qwen. Di antara mereka, harga input model Qwen-Long turun dari 0,02 yuan per seribu tokens menjadi 0,5 yuan per satu juta tokens, dengan penurunan mencapai 97%. Langkah ini menandai datangnya gelombang penurunan harga di industri model besar.
Sebelumnya, Ali Tongyi merilis model sumber terbuka Qwen1.5-110B dengan jumlah parameter mencapai 1100 k. Model ini menunjukkan kinerja yang sangat baik dalam berbagai pengujian tolok ukur, melampaui model Meta Llama-3-70B, dan menduduki peringkat teratas di papan peringkat model besar sumber terbuka HuggingFace.
"Penurunan harga + sumber terbuka" secara bertahap menjadi konsensus di kalangan produsen model besar global. Ini membantu mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi dan kualitas model sumber terbuka yang kurang, sehingga mendorong perkembangan aplikasi AI secara menyeluruh.
Faktanya, Tongyi Qianwen bukanlah model besar pertama yang menurunkan harga untuk pengembang. Sejak bulan Mei, banyak perusahaan model besar telah meluncurkan produk dengan harga rendah atau melakukan penurunan harga:
DeepSeek di bawah Huanfang Quantitative melakukan penelitian mendalam (Model MoE generasi kedua sumber terbuka, harga API hanya sekitar satu persen dari model terkenal.
Sebuah perusahaan AI menurunkan harga panggilan model versi pribadi mereka dari 5 yuan per juta tokens menjadi 1 yuan.
Sebuah perusahaan AI internasional terkenal meluncurkan model versi baru, yang meningkatkan kecepatan panggilan API dua kali lipat sambil mempertahankan kinerjanya, dan harganya dipotong setengah.
Penetapan harga input model inferensi utama dari suatu perusahaan teknologi domestik hanya sebesar 0,0008 yuan per kTokens.
Sebuah perusahaan teknologi besar mengumumkan bahwa dua model utama mereka akan dibuka secara gratis.
Sebuah perusahaan AI mengumumkan bahwa API Lite mereka akan tersedia secara gratis selamanya.
Gelombang penurunan harga ini mungkin berasal dari kemajuan teknologi inferensi model besar dan penurunan biaya, secara objektif memberikan lebih banyak pilihan kepada pengembang, yang menguntungkan pengembangan aplikasi AI.
Selain penurunan harga, Ali Tongyi juga meluncurkan berbagai ukuran model bahasa besar untuk memenuhi kebutuhan berbagai skenario. Model kecil )0.5B-14B( dapat diterapkan di perangkat seluler; model besar )72B-110B( mendukung aplikasi tingkat perusahaan dan penelitian; model menengah )32B( mencari keseimbangan antara kinerja, efisiensi, dan penggunaan memori. Selain itu, Tongyi juga telah mengopen-source model multimodal seperti visual, audio, dan kode. Langkah-langkah ini akan mendukung beragam skenario aplikasi AI.