Обучение больших моделей ИИ сталкивается с проблемами, нехватка вычислительной мощности вызывает кризис в отрасли и меры по его преодолению.

robot
Генерация тезисов в процессе

Вычислительная мощность: трудности и решения в обучении больших моделей

Обучение больших моделей идет полным ходом, но нехватка высококлассных GPU стала одной из серьезных проблем, с которыми сталкивается отрасль. Несмотря на постоянный рост цен, аренда одного топового GPU уже достигает 50-70 тысяч юаней в месяц, но все равно его трудно достать. Эта ситуация нехватки в краткосрочной перспективе вряд ли улучшится, и все крупные компании рассчитывают, сколько "товара" у них в наличии.

Однако порог входа для обучения больших моделей не ограничивается простым приобретением GPU. Например, для одной метеорологической большой модели затраты на обучение превышают 2 миллиона юаней. Для универсальных больших моделей сложно продолжать без инвестиций в десятки миллиардов. Некоторые предприниматели описывают текущую конкурентную среду в области больших моделей как "сжигание денег"; без значительной финансовой поддержки трудно продержаться.

Сталкиваясь с этой проблемой, компании активно ищут способы реагирования. Некоторые методы включают: использование данных более высокого качества для повышения эффективности обучения; улучшение инфраструктурных возможностей для обеспечения длительной стабильной работы; оптимизация распределения вычислительной мощности для повышения коэффициента использования; замена облачной вычислительной архитектуры на суперкомпьютерную архитектуру и т.д. Кроме того, некоторые компании выбирают использование отечественных платформ для обучения и вывода больших моделей, чтобы заменить дефицитные импортные GPU.

На самом деле, вычислительная мощность становится новой моделью сервиса. Сервис вычислительной мощности основан на разнообразной вычислительной мощности и направлен на предоставление эффективной вычислительной мощности через связь вычислительных сетей. Он включает не только вычислительную мощность, но и охватывает унифицированную упаковку ресурсов, таких как хранение и сеть. В этой цепочке поставок компании на верхнем уровне поставляют основные ресурсы вычислительной мощности, компании среднего уровня отвечают за производство и поставку вычислительной мощности, а нижний уровень – это отраслевые пользователи, которые зависят от сервисов вычислительной мощности для создания добавленной стоимости.

С увеличением спроса на высокопроизводительные вычисления со стороны больших моделей, сервисы вычислительной мощности быстро развиваются в уникальную отрасль и бизнес-модель. Несмотря на то, что в настоящее время существует нехватка высококлассных GPU и высокие затраты, в долгосрочной перспективе сервисы вычислительной мощности являются определенной тенденцией. Поставщики сервисов вычислительной мощности должны заранее подготовиться к изменениям на рынке.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Поделиться
комментарий
0/400
TooScaredToSellvip
· 22ч назад
Нет сил - беги быстро, сжигая наличные
Посмотреть ОригиналОтветить0
CompoundPersonalityvip
· 22ч назад
Пошел майнить на GPU, прощайте.
Посмотреть ОригиналОтветить0
RektButSmilingvip
· 22ч назад
Игроки, использующие читы, снова появились.
Посмотреть ОригиналОтветить0
NeverPresentvip
· 23ч назад
Сколько же стоят эти GPU, это просто невероятно!
Посмотреть ОригиналОтветить0
  • Закрепить