Навчання великих моделей штучного інтелекту стикається з труднощами, брак обчислювальної потужності спричиняє труднощі в галузі та способи їх подолання.

robot
Генерація анотацій у процесі

Обчислювальна потужність коротка: труднощі та рішення навчання великих моделей

Велике навчання моделей проходить на повному ходу, але нестача висококласних графічних процесорів стала великою проблемою для галузі. Незважаючи на те, що ціни постійно зростають, місячна орендна плата за топовий графічний процесор досягла 50-70 тисяч юанів, але все ще важко знайти карту. Ця ситуація з дефіцитом у короткостроковій перспективі навряд чи поліпшиться, і великі компанії вже підраховують, скільки "товару" у них є.

Однак, поріг для навчання великих моделей не лише в отриманні GPU. Наприклад, вартість навчання певної метеорологічної великої моделі перевищує 2 мільйони юанів. Для універсальних великих моделей важко підтримувати процес без інвестицій у десятки мільярдів. Деякі підприємці описують нинішню конкуренцію у сфері великих моделей як "спалювання грошей", і без значної фінансової підтримки важко витримати.

Стикаючись з цією кризою, компанії також активно шукають способи реагування. Деякі з методів включають: використання якісніших даних для підвищення ефективності навчання; підвищення потужностей інфраструктури для забезпечення тривалої стабільної роботи; оптимізація обчислювальної потужності для підвищення коефіцієнта використання; використання суперкомп'ютерних архітектур замість хмарних обчислень тощо. Крім того, деякі компанії обирають використовувати вітчизняні платформи для навчання та інференції великих моделей, щоб замінити дефіцитні імпортні GPU.

Насправді, Обчислювальна потужність вже стає новою моделлю послуг. Послуги обчислювальної потужності базуються на різноманітній обчислювальній потужності, з'єднуючи через мережу обчислювальної потужності, щоб забезпечити ефективну обчислювальну потужність. Це не тільки включає обчислювальну потужність, але також охоплює єдину упаковку ресурсів, таких як зберігання, мережа тощо. У цій виробничій ланцюзі, підприємства на верхньому рівні постачають базові ресурси обчислювальної потужності, підприємства середнього рівня відповідають за виробництво та постачання обчислювальної потужності, а нижній рівень - це галузеві користувачі, які покладаються на послуги обчислювальної потужності для створення додаткової вартості.

З огляду на нормалізацію вимог до обчислювальної потужності з боку великих моделей, послуги обчислювальної потужності швидко розвиваються в унікальний виробничий ланцюг і бізнес-модель. Незважаючи на те, що в даний час існує проблема нестачі висококласних GPU та їх високих витрат, в довгостроковій перспективі послуги обчислювальної потужності є визначеною тенденцією. Постачальникам послуг обчислювальної потужності необхідно заздалегідь підготуватися до змін на ринку.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • Поділіться
Прокоментувати
0/400
TooScaredToSellvip
· 08-06 10:11
Не маєш сил - біжи, горюючи готівкою.
Переглянути оригіналвідповісти на0
CompoundPersonalityvip
· 08-06 10:09
Пішов торгувати GPU, прощавай.
Переглянути оригіналвідповісти на0
RektButSmilingvip
· 08-06 10:06
Гравець-спекулянт знову з'явився
Переглянути оригіналвідповісти на0
NeverPresentvip
· 08-06 09:59
Вражає, як високі ціни на ці GPU.
Переглянути оригіналвідповісти на0
  • Закріпити