AI热潮下的百模大战：算力暴涨盈利难寻

RugResistant

2025-07-08 04:35:54

AI领域群魔乱舞：一国一模亩产十万斤

上个月，AI业界掀起了一场"动物之争"。

一方是Llama，因其开源特性深受开发者喜爱。日本电气公司研究了Llama论文和代码后，迅速开发出日语版ChatGPT，解决了日本在AI领域的瓶颈问题。

另一方是名为Falcon的大模型。今年5月，Falcon-40B问世，超越Llama登顶"开源LLM排行榜"。该榜单由开源模型社区制作，提供了评估LLM能力的标准。排行榜上基本是Llama和Falcon轮流占据榜首。

Llama 2推出后，Llama家族一度反超；但9月初，Falcon推出180B版本，再次获得更高排名。

有趣的是，Falcon的开发者并非科技公司，而是阿联酋首都的一家科技创新研究所。政府人士表示，他们参与这个领域是为了颠覆核心玩家。

180B版本发布次日，阿联酋人工智能部长入选《时代周刊》评选的"AI领域最具影响力的100人"；与他一同入选的还有"AI教父"辛顿、OpenAI的阿尔特曼等人。

如今，AI领域已进入百家争鸣阶段：有实力的国家和企业都在打造自己的大语言模型。仅在海湾地区，就不止一个参与者。8月，沙特为国内大学购买了3000多块H100芯片，用于训练LLM。

有投资人曾吐槽："当年看不起互联网的商业模式创新，觉得没有壁垒：百团大战、百车大战、百播大战；没想到硬科技大模型创业，依然是百模大战..."

本应高门槛的硬科技，怎么变成了人人都能参与的领域？

Transformer吞噬世界

无论是美国初创公司、中国科技巨头，还是中东石油大亨，他们能够投身大模型领域，都要感谢那篇著名的论文：《Attention Is All You Need》。

2017年，8位计算机科学家在这篇论文中公开了Transformer算法。这篇论文目前是AI历史上被引用第三多的论文，Transformer的出现引发了此轮AI热潮。

当前所有大模型，包括轰动世界的GPT系列，都建立在Transformer的基础之上。

在此之前，"教机器读书"一直是公认的学术难题。与图像识别不同，人类阅读时不仅关注当前词句，还会结合上下文理解。

早期神经网络的输入彼此独立，无法理解长文本甚至整篇文章，因此常出现一些荒谬的翻译结果。

2014年，谷歌的科学家伊利亚首次取得突破。他使用循环神经网络(RNN)处理自然语言，使谷歌翻译的性能大幅提升。

RNN提出了"循环设计"，让每个神经元既接受当前输入，也接受上一时刻的输入，从而具备了"结合上下文"的能力。

RNN的出现激发了学术界的研究热情，Transformer的论文作者沙泽尔也曾深入研究。然而开发者们很快发现RNN存在严重缺陷：

该算法使用顺序计算，虽然解决了上下文问题，但运行效率低下，难以处理大量参数。

RNN的繁琐设计很快让沙泽尔感到厌烦。因此从2015年开始，沙泽尔和7位同好着手开发RNN的替代品，其成果就是Transformer。

相比RNN，Transformer有两大革新：

一是用位置编码替代了RNN的循环设计，实现了并行计算，大大提升了训练效率，使其能够处理大数据，将AI推向大模型时代；二是进一步增强了理解上下文的能力。

Transformer一举解决了多个缺陷，逐渐成为NLP领域的主流方案，有"天不生Transformer，NLP万古如长夜"之感。连伊利亚都放弃了自己开创的RNN，转而支持Transformer。

换言之，Transformer是当今所有大模型的基石，它将大模型从理论研究转变为纯工程问题。

2019年，OpenAI基于Transformer开发出GPT-2，震惊了学术界。作为回应，谷歌迅速推出了性能更强的AI，名为Meena。

与GPT-2相比，Meena并无算法突破，仅是增加了8.5倍的训练参数和14倍的算力。Transformer论文作者沙泽尔对这种"暴力堆砌"方式深感震撼，随即写了篇"Meena吞噬世界"的备忘录。

Transformer的问世，使学术界的底层算法创新速度大幅放缓。数据工程、算力规模、模型架构等工程要素，逐渐成为AI竞赛的关键，只要有一定技术能力的科技公司都能开发出大模型。

因此，计算机科学家吴恩达在斯坦福大学演讲时提出："AI是一系列工具的集合，包括监督学习、无监督学习、强化学习以及现在的生成式人工智能。这些都是通用技术，类似于电力和互联网等其他通用技术。"

虽然OpenAI仍是LLM的领跑者，但半导体分析机构Semi Analysis认为，GPT-4的竞争力主要来自工程解决方案——如果开源，任何竞争对手都能迅速复制。

该分析师预计，其他大型科技公司可能很快就能开发出与GPT-4性能相当的大模型。

建在玻璃上的护城河

如今，"百模大战"已不再是一种比喻，而是客观现实。

相关报告显示，截至今年7月，国内大模型数量已达130个，超过美国的114个，实现了弯道超车，各种神话传说几乎不够国内科技公司命名的了。

在中美之外，许多较富裕国家也基本实现了"一国一模"：除了日本与阿联酋，还有印度政府主导的大模型Bhashini、韩国互联网公司Naver打造的HyperClova X等。

这种场景，让人想起了那个泡沫满天飞、"钞能力"决定一切的互联网拓荒时代。

正如前文所述，Transformer使大模型变成了纯工程问题，只要有人才、资金和硬件，剩下的就交给参数。但入场门槛的降低并不意味着人人都能成为AI时代的巨头。

开头提到的"动物之争"就是个典型案例：尽管Falcon在排名上超越了Llama，但很难说对Meta造成了多大影响。

众所周知，企业开源自身的科研成果，既是为了与社会分享科技成果，也希望能激发群众智慧。随着各大学教授、研究机构、中小企业不断使用、改进Llama，Meta可以将这些成果应用于自己的产品中。

对开源大模型而言，活跃的开发者社区才是其核心竞争力。

早在2015年组建AI实验室时，Meta就确立了开源的基本方针；扎克伯格凭借社交媒体起家，更懂得"维护群众关系"的重要性。

比如在10月，Meta专门举办了一个"AI版创作者激励"活动：使用Llama 2解决教育、环境等社会问题的开发者，有机会获得50万美元的资助。

如今，Meta的Llama系列已成为开源LLM的风向标。

截至10月初，某开源LLM排行榜Top 10中，有8个都是基于Llama 2开发的，均使用了其开源协议。仅在该平台上，使用Llama 2开源协议的LLM已超过1500个。

当然，像Falcon那样提升性能也未尝不可，但目前市面上大多数LLM与GPT-4仍有明显差距。

例如前不久，GPT-4以4.41分的成绩在AgentBench测试中排名第一。AgentBench是由清华大学与俄亥俄州立大学、加州大学伯克利分校共同推出的标准，用于评估LLM在多维度开放式生成环境中的推理能力和决策能力，测试内容包括操作系统、数据库、知识图谱、卡牌对战等8个不同环境的任务。

测试结果显示，第二名的Claude只有2.77分，差距仍然明显。至于那些声势浩大的开源LLM，其测试成绩多在1分左右，还不到GPT-4的四分之一。

要知道，GPT-4发布于今年3月，这还是全球同行追赶了大半年后的成绩。而造成这种差距的，是OpenAI高水平的科学家团队与长期研究LLM积累的经验，因此能始终保持领先地位。

换句话说，大模型的核心能力并非参数，而是生态建设（开源）或纯粹的推理能力（闭源）。

随着开源社区日益活跃，各个LLM的性能可能会趋同，因为大家都在使用相似的模型架构与数据集。

另一个更直观的问题是：除了Midjourney，似乎还没有哪个大模型能实现盈利。

价值的锚点

今年8月，一篇题为"OpenAI可能会于2024年底破产"的文章引起了不少关注。文章主旨几乎可以用一句话概括：OpenAI的烧钱速度太快了。

文中提到，自开发ChatGPT以来，OpenAI的亏损正在迅速扩大，仅2022年就亏损约5.4亿美元，只能等待微软投资人买单。

文章标题虽然耸人听闻，却也道出了众多大模型提供商的现状：成本与收入严重失衡。

过高的成本导致目前依靠人工智能赚大钱的只有英伟达，顶多再加上博通。

据咨询公司Omdia估计，英伟达在今年二季度售出了超30万块H100。这是一款AI芯片，训练AI的效率极高，全球的科技公司、科研机构都在争相购买。如果将售出的这30万块H100叠在一起，其重量相当于4.5架波音747飞机。

英伟达的业绩也随之飙升，同比营收增长854%，令华尔街大为震惊。值得一提的是，目前H100在二手市场的价格已被炒到4-5万美元，而其物料成本仅约3000美元。

高昂的算力成本已在某种程度上成为行业发展的阻力。红杉资本曾做过一项估算：全球科技公司每年预计将花费2000亿美元用于大模型基础设施建设；相比之下，大模型每年最多只能产生750亿美元的收入，中间存在至少1250亿美元的缺口。

此外，除了Midjourney等少数例外，大多数软件公司在付出巨大成本后，还没想清楚如何盈利。特别是行业的两大领军者——微软和Adobe的表现都有些不尽如人意。

微软和OpenAI曾合作开发了一个AI代码生成工具GitHub Copilot，虽然每月收取10美元会费，但由于设施成本，微软反而要亏损20美元，重度用户甚至能让微软每月亏损80美元。据此推测，定价30美元的Microsoft 365 Copilot，可能亏损更多。

同样，刚推出Firefly AI工具的Adobe也迅速引入了一个配套的积分系统，防止用户过度使用导致公司亏损。一旦用户使用超过每月分配的积分，Adobe就会降低服务速度。

要知道微软和Adobe已经是业务场景明确，拥有大量现有付费用户的软件巨头。而大多数参数堆积如山的大模型，最主要的应用场景仍然是聊天。

不可否认，如果没有OpenAI和ChatGPT的横空出世，这场AI革命可能根本不会发生；但在当前，训练大模型所带来的价值恐怕需要打一个问号。

而且，随着同质化竞争加剧，以及市面上开源模型越来越多，留给单纯的大模型供应商的空间可能会更小。

iPhone 4的成功不是因为45nm制程的A4处理器，而是它可以玩植物大战僵尸和愤怒的小鸟。

GPT1.67%

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

9人点赞了这条动态

赞赏
9
5
分享

0/400

MetaMask Mechanic

· 07-11 04:21

跟大炼钢铁似的

分叉小王子

· 07-10 13:58

模型打架科技还是科技

戴上帽子说话

· 07-08 05:03

谁亩产高谁是老大呗

MEV受害者互助会

· 07-08 05:02

炒作数字还能再大点不

稳定币守护者

· 07-08 04:45

这两模型争的还挺激烈能有啥实质用处么

话题
BTC再创新高
74236 热度
ETH突破3000
31232 热度
VIP 专属空投嘉年华
8979 热度
4我的Gate时刻
10187 热度
5美联储6月会议纪要
3803 热度
6Gate首发Pump.Fun
3733 热度
7美加征关税
14897 热度
8Gate xStocks 交易体验
21625 热度
9香港稳定币条例
2507 热度
10TruthSocial加密蓝筹ETF
2165 热度

AI热潮下的百模大战：算力暴涨 盈利难寻

AI领域群魔乱舞：一国一模亩产十万斤

Transformer吞噬世界

建在玻璃上的护城河

价值的锚点

AI热潮下的百模大战：算力暴涨盈利难寻