AI热潮下的百模大战:算力暴涨 盈利难寻

AI领域群魔乱舞:一国一模亩产十万斤

上个月,AI业界掀起了一场"动物之争"。

一方是Llama,因其开源特性深受开发者喜爱。日本电气公司研究了Llama论文和代码后,迅速开发出日语版ChatGPT,解决了日本在AI领域的瓶颈问题。

另一方是名为Falcon的大模型。今年5月,Falcon-40B问世,超越Llama登顶"开源LLM排行榜"。该榜单由开源模型社区制作,提供了评估LLM能力的标准。排行榜上基本是Llama和Falcon轮流占据榜首。

Llama 2推出后,Llama家族一度反超;但9月初,Falcon推出180B版本,再次获得更高排名。

有趣的是,Falcon的开发者并非科技公司,而是阿联酋首都的一家科技创新研究所。政府人士表示,他们参与这个领域是为了颠覆核心玩家。

180B版本发布次日,阿联酋人工智能部长入选《时代周刊》评选的"AI领域最具影响力的100人";与他一同入选的还有"AI教父"辛顿、OpenAI的阿尔特曼等人。

如今,AI领域已进入百家争鸣阶段:有实力的国家和企业都在打造自己的大语言模型。仅在海湾地区,就不止一个参与者。8月,沙特为国内大学购买了3000多块H100芯片,用于训练LLM。

有投资人曾吐槽:"当年看不起互联网的商业模式创新,觉得没有壁垒:百团大战、百车大战、百播大战;没想到硬科技大模型创业,依然是百模大战..."

本应高门槛的硬科技,怎么变成了人人都能参与的领域?

Transformer吞噬世界

无论是美国初创公司、中国科技巨头,还是中东石油大亨,他们能够投身大模型领域,都要感谢那篇著名的论文:《Attention Is All You Need》。

2017年,8位计算机科学家在这篇论文中公开了Transformer算法。这篇论文目前是AI历史上被引用第三多的论文,Transformer的出现引发了此轮AI热潮。

当前所有大模型,包括轰动世界的GPT系列,都建立在Transformer的基础之上。

在此之前,"教机器读书"一直是公认的学术难题。与图像识别不同,人类阅读时不仅关注当前词句,还会结合上下文理解。

早期神经网络的输入彼此独立,无法理解长文本甚至整篇文章,因此常出现一些荒谬的翻译结果。

2014年,谷歌的科学家伊利亚首次取得突破。他使用循环神经网络(RNN)处理自然语言,使谷歌翻译的性能大幅提升。

RNN提出了"循环设计",让每个神经元既接受当前输入,也接受上一时刻的输入,从而具备了"结合上下文"的能力。

RNN的出现激发了学术界的研究热情,Transformer的论文作者沙泽尔也曾深入研究。然而开发者们很快发现RNN存在严重缺陷:

该算法使用顺序计算,虽然解决了上下文问题,但运行效率低下,难以处理大量参数。

RNN的繁琐设计很快让沙泽尔感到厌烦。因此从2015年开始,沙泽尔和7位同好着手开发RNN的替代品,其成果就是Transformer。

相比RNN,Transformer有两大革新:

一是用位置编码替代了RNN的循环设计,实现了并行计算,大大提升了训练效率,使其能够处理大数据,将AI推向大模型时代;二是进一步增强了理解上下文的能力。

Transformer一举解决了多个缺陷,逐渐成为NLP领域的主流方案,有"天不生Transformer,NLP万古如长夜"之感。连伊利亚都放弃了自己开创的RNN,转而支持Transformer。

换言之,Transformer是当今所有大模型的基石,它将大模型从理论研究转变为纯工程问题。

2019年,OpenAI基于Transformer开发出GPT-2,震惊了学术界。作为回应,谷歌迅速推出了性能更强的AI,名为Meena。

与GPT-2相比,Meena并无算法突破,仅是增加了8.5倍的训练参数和14倍的算力。Transformer论文作者沙泽尔对这种"暴力堆砌"方式深感震撼,随即写了篇"Meena吞噬世界"的备忘录。

Transformer的问世,使学术界的底层算法创新速度大幅放缓。数据工程、算力规模、模型架构等工程要素,逐渐成为AI竞赛的关键,只要有一定技术能力的科技公司都能开发出大模型。

因此,计算机科学家吴恩达在斯坦福大学演讲时提出:"AI是一系列工具的集合,包括监督学习、无监督学习、强化学习以及现在的生成式人工智能。这些都是通用技术,类似于电力和互联网等其他通用技术。"

虽然OpenAI仍是LLM的领跑者,但半导体分析机构Semi Analysis认为,GPT-4的竞争力主要来自工程解决方案——如果开源,任何竞争对手都能迅速复制。

该分析师预计,其他大型科技公司可能很快就能开发出与GPT-4性能相当的大模型。

建在玻璃上的护城河

如今,"百模大战"已不再是一种比喻,而是客观现实。

相关报告显示,截至今年7月,国内大模型数量已达130个,超过美国的114个,实现了弯道超车,各种神话传说几乎不够国内科技公司命名的了。

在中美之外,许多较富裕国家也基本实现了"一国一模":除了日本与阿联酋,还有印度政府主导的大模型Bhashini、韩国互联网公司Naver打造的HyperClova X等。

这种场景,让人想起了那个泡沫满天飞、"钞能力"决定一切的互联网拓荒时代。

正如前文所述,Transformer使大模型变成了纯工程问题,只要有人才、资金和硬件,剩下的就交给参数。但入场门槛的降低并不意味着人人都能成为AI时代的巨头。

开头提到的"动物之争"就是个典型案例:尽管Falcon在排名上超越了Llama,但很难说对Meta造成了多大影响。

众所周知,企业开源自身的科研成果,既是为了与社会分享科技成果,也希望能激发群众智慧。随着各大学教授、研究机构、中小企业不断使用、改进Llama,Meta可以将这些成果应用于自己的产品中。

对开源大模型而言,活跃的开发者社区才是其核心竞争力。

早在2015年组建AI实验室时,Meta就确立了开源的基本方针;扎克伯格凭借社交媒体起家,更懂得"维护群众关系"的重要性。

比如在10月,Meta专门举办了一个"AI版创作者激励"活动:使用Llama 2解决教育、环境等社会问题的开发者,有机会获得50万美元的资助。

如今,Meta的Llama系列已成为开源LLM的风向标。

截至10月初,某开源LLM排行榜Top 10中,有8个都是基于Llama 2开发的,均使用了其开源协议。仅在该平台上,使用Llama 2开源协议的LLM已超过1500个。

当然,像Falcon那样提升性能也未尝不可,但目前市面上大多数LLM与GPT-4仍有明显差距。

例如前不久,GPT-4以4.41分的成绩在AgentBench测试中排名第一。AgentBench是由清华大学与俄亥俄州立大学、加州大学伯克利分校共同推出的标准,用于评估LLM在多维度开放式生成环境中的推理能力和决策能力,测试内容包括操作系统、数据库、知识图谱、卡牌对战等8个不同环境的任务。

测试结果显示,第二名的Claude只有2.77分,差距仍然明显。至于那些声势浩大的开源LLM,其测试成绩多在1分左右,还不到GPT-4的四分之一。

要知道,GPT-4发布于今年3月,这还是全球同行追赶了大半年后的成绩。而造成这种差距的,是OpenAI高水平的科学家团队与长期研究LLM积累的经验,因此能始终保持领先地位。

换句话说,大模型的核心能力并非参数,而是生态建设(开源)或纯粹的推理能力(闭源)。

随着开源社区日益活跃,各个LLM的性能可能会趋同,因为大家都在使用相似的模型架构与数据集。

另一个更直观的问题是:除了Midjourney,似乎还没有哪个大模型能实现盈利。

价值的锚点

今年8月,一篇题为"OpenAI可能会于2024年底破产"的文章引起了不少关注。文章主旨几乎可以用一句话概括:OpenAI的烧钱速度太快了。

文中提到,自开发ChatGPT以来,OpenAI的亏损正在迅速扩大,仅2022年就亏损约5.4亿美元,只能等待微软投资人买单。

文章标题虽然耸人听闻,却也道出了众多大模型提供商的现状:成本与收入严重失衡。

过高的成本导致目前依靠人工智能赚大钱的只有英伟达,顶多再加上博通。

据咨询公司Omdia估计,英伟达在今年二季度售出了超30万块H100。这是一款AI芯片,训练AI的效率极高,全球的科技公司、科研机构都在争相购买。如果将售出的这30万块H100叠在一起,其重量相当于4.5架波音747飞机。

英伟达的业绩也随之飙升,同比营收增长854%,令华尔街大为震惊。值得一提的是,目前H100在二手市场的价格已被炒到4-5万美元,而其物料成本仅约3000美元。

高昂的算力成本已在某种程度上成为行业发展的阻力。红杉资本曾做过一项估算:全球科技公司每年预计将花费2000亿美元用于大模型基础设施建设;相比之下,大模型每年最多只能产生750亿美元的收入,中间存在至少1250亿美元的缺口。

此外,除了Midjourney等少数例外,大多数软件公司在付出巨大成本后,还没想清楚如何盈利。特别是行业的两大领军者——微软和Adobe的表现都有些不尽如人意。

微软和OpenAI曾合作开发了一个AI代码生成工具GitHub Copilot,虽然每月收取10美元会费,但由于设施成本,微软反而要亏损20美元,重度用户甚至能让微软每月亏损80美元。据此推测,定价30美元的Microsoft 365 Copilot,可能亏损更多。

同样,刚推出Firefly AI工具的Adobe也迅速引入了一个配套的积分系统,防止用户过度使用导致公司亏损。一旦用户使用超过每月分配的积分,Adobe就会降低服务速度。

要知道微软和Adobe已经是业务场景明确,拥有大量现有付费用户的软件巨头。而大多数参数堆积如山的大模型,最主要的应用场景仍然是聊天。

不可否认,如果没有OpenAI和ChatGPT的横空出世,这场AI革命可能根本不会发生;但在当前,训练大模型所带来的价值恐怕需要打一个问号。

而且,随着同质化竞争加剧,以及市面上开源模型越来越多,留给单纯的大模型供应商的空间可能会更小。

iPhone 4的成功不是因为45nm制程的A4处理器,而是它可以玩植物大战僵尸和愤怒的小鸟。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 分享
评论
0/400
MetaMask Mechanicvip
· 07-11 04:21
跟大炼钢铁似的
回复0
分叉小王子vip
· 07-10 13:58
模型打架 科技还是科技
回复0
戴上帽子说话vip
· 07-08 05:03
谁亩产高谁是老大呗
回复0
MEV受害者互助会vip
· 07-08 05:02
炒作 数字还能再大点不
回复0
稳定币守护者vip
· 07-08 04:45
这两模型争的还挺激烈 能有啥实质用处么
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)