2025-07-27 11:53:26

AI訓練是一個有趣的領域，特別是對於分布式訓練網路，它們正在訓練的模型比它們所使用的GPU要小。大多數網路正在進行1.5B、3B和8B模型的訓練，以便適應消費級GPU。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

16人點讚了這條動態

讚賞
16
5
分享

留言

0/400

链游脱坑专家

· 07-28 03:18

这参数配置看的头大

回復0

Token风暴

· 07-27 12:20

1.5B也算训? 数据量小的抖动系数太高了吧

回復0

DeFiCaffeinator

· 07-27 12:16

现在已经瓦特了？

回復0

薛定谔的gas

· 07-27 12:10

趣味性效率显着小于最优帕累托均衡啊

查看原文回復0

空投刷子姐

· 07-27 12:05

欸没人嫌GPU太大吧

回復0