Daya Komputasi yang Langka: Dilema Pelatihan Model Besar dan Solusinya
Pelatihan model besar sedang berlangsung dengan sangat pesat, tetapi kekurangan GPU kelas atas menjadi tantangan besar yang dihadapi industri. Meskipun harga terus merangkak naik, sewa bulanan untuk satu GPU kelas atas sudah mencapai 50-70 juta, tetapi tetap sulit untuk mendapatkan satu. Situasi kekurangan ini sulit untuk diatasi dalam jangka pendek, dan perusahaan-perusahaan besar sedang menghitung berapa "barang" yang mereka miliki.
Namun, ambang batas untuk pelatihan model besar tidak hanya sekadar mendapatkan GPU. Sebagai contoh, biaya pelatihan untuk sebuah model besar meteorologi melebihi 2 juta yuan. Untuk model besar umum, sulit untuk terus berlanjut tanpa investasi miliaran. Beberapa pengusaha menggambarkan persaingan di bidang model besar saat ini seperti "membakar uang", jika tidak memiliki dukungan dana yang kuat, sulit untuk bertahan.
Menghadapi tantangan ini, perusahaan-perusahaan juga aktif mencari solusi. Beberapa metode yang termasuk: menggunakan data berkualitas lebih tinggi untuk meningkatkan efisiensi pelatihan; meningkatkan kemampuan infrastruktur untuk mencapai operasi yang stabil dalam waktu lama; mengoptimalkan Daya Komputasi sumber daya, meningkatkan tingkat pemanfaatan; mengadopsi arsitektur superkomputer sebagai pengganti arsitektur komputasi awan, dan lain-lain. Selain itu, beberapa perusahaan memilih untuk menggunakan platform lokal untuk pelatihan dan inferensi model besar, sebagai pengganti GPU impor yang langka.
Faktanya, Daya Komputasi telah menjadi model layanan baru. Layanan Daya Komputasi didasarkan pada Daya Komputasi yang beragam, menghubungkan melalui jaringan Daya Komputasi, dengan tujuan menyediakan Daya Komputasi yang efektif. Ini tidak hanya mencakup Daya Komputasi, tetapi juga mencakup pengemasan terpadu dari sumber daya seperti penyimpanan, jaringan, dan lainnya. Dalam rantai industri ini, perusahaan hulu menyediakan sumber daya Daya Komputasi dasar, perusahaan menengah bertanggung jawab atas produksi dan pasokan Daya Komputasi, sedangkan hulu bergantung pada layanan Daya Komputasi untuk menciptakan nilai tambah bagi pengguna industri.
Seiring dengan normalisasi kebutuhan komputasi berkinerja tinggi oleh model besar, layanan daya komputasi dengan cepat berkembang menjadi rantai industri dan model bisnis yang unik. Meskipun saat ini masih ada masalah kekurangan GPU kelas atas dan biaya yang tinggi, namun dalam jangka panjang, layanan daya komputasi adalah tren yang pasti. Penyedia layanan daya komputasi perlu bersiap-siap untuk menghadapi perubahan pasar.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
9 Suka
Hadiah
9
4
Bagikan
Komentar
0/400
TooScaredToSell
· 08-06 10:11
Tidak punya kekuatan cepat lari, membakar uang tunai.
Lihat AsliBalas0
CompoundPersonality
· 08-06 10:09
Saya pergi untuk trading GPU, selamat tinggal.
Lihat AsliBalas0
RektButSmiling
· 08-06 10:06
Pemain炸卡 muncul lagi
Lihat AsliBalas0
NeverPresent
· 08-06 09:59
Merasa terkesan dengan harga GPU yang benar-benar mencengangkan.
Pelatihan model besar AI menghadapi kendala, kekurangan daya komputasi menyebabkan kesulitan industri dan tanggapan.
Daya Komputasi yang Langka: Dilema Pelatihan Model Besar dan Solusinya
Pelatihan model besar sedang berlangsung dengan sangat pesat, tetapi kekurangan GPU kelas atas menjadi tantangan besar yang dihadapi industri. Meskipun harga terus merangkak naik, sewa bulanan untuk satu GPU kelas atas sudah mencapai 50-70 juta, tetapi tetap sulit untuk mendapatkan satu. Situasi kekurangan ini sulit untuk diatasi dalam jangka pendek, dan perusahaan-perusahaan besar sedang menghitung berapa "barang" yang mereka miliki.
Namun, ambang batas untuk pelatihan model besar tidak hanya sekadar mendapatkan GPU. Sebagai contoh, biaya pelatihan untuk sebuah model besar meteorologi melebihi 2 juta yuan. Untuk model besar umum, sulit untuk terus berlanjut tanpa investasi miliaran. Beberapa pengusaha menggambarkan persaingan di bidang model besar saat ini seperti "membakar uang", jika tidak memiliki dukungan dana yang kuat, sulit untuk bertahan.
Menghadapi tantangan ini, perusahaan-perusahaan juga aktif mencari solusi. Beberapa metode yang termasuk: menggunakan data berkualitas lebih tinggi untuk meningkatkan efisiensi pelatihan; meningkatkan kemampuan infrastruktur untuk mencapai operasi yang stabil dalam waktu lama; mengoptimalkan Daya Komputasi sumber daya, meningkatkan tingkat pemanfaatan; mengadopsi arsitektur superkomputer sebagai pengganti arsitektur komputasi awan, dan lain-lain. Selain itu, beberapa perusahaan memilih untuk menggunakan platform lokal untuk pelatihan dan inferensi model besar, sebagai pengganti GPU impor yang langka.
Faktanya, Daya Komputasi telah menjadi model layanan baru. Layanan Daya Komputasi didasarkan pada Daya Komputasi yang beragam, menghubungkan melalui jaringan Daya Komputasi, dengan tujuan menyediakan Daya Komputasi yang efektif. Ini tidak hanya mencakup Daya Komputasi, tetapi juga mencakup pengemasan terpadu dari sumber daya seperti penyimpanan, jaringan, dan lainnya. Dalam rantai industri ini, perusahaan hulu menyediakan sumber daya Daya Komputasi dasar, perusahaan menengah bertanggung jawab atas produksi dan pasokan Daya Komputasi, sedangkan hulu bergantung pada layanan Daya Komputasi untuk menciptakan nilai tambah bagi pengguna industri.
Seiring dengan normalisasi kebutuhan komputasi berkinerja tinggi oleh model besar, layanan daya komputasi dengan cepat berkembang menjadi rantai industri dan model bisnis yang unik. Meskipun saat ini masih ada masalah kekurangan GPU kelas atas dan biaya yang tinggi, namun dalam jangka panjang, layanan daya komputasi adalah tren yang pasti. Penyedia layanan daya komputasi perlu bersiap-siap untuk menghadapi perubahan pasar.