时间:2024-05-14|浏览:227
原文标题:《Flipping the AI coin》
原文作者:Gagra Ventures
原文编译:Fairy,ChainCatcher
编者按:作者透过技术的光环,看到了 Web3 项目在推进 AI 发展中所面临的资本、硬件等多重障碍。尽管 Web3 的初衷是打破中心化,实现去中心化的理想,但在实际操作中,却往往受到市场叙事和代币激励的左右,偏离了初衷。
ChainCatcher 将原文编译如下:
AI 和 Web3 结合的呼声越来越高,但这不再是一篇乐观的风投文章。我们对合并这两种技术感到乐观,但下面的文字是一种呼吁。否则,这种乐观将无法实现。
为什么?因为开发和运行最佳 AI 模型需要巨额资本支出,最先进的硬件通常难以获得,而且需要非常特定领域的研发。像大多数 Web3 人工智能项目正在做的那样,通过加密激励来众包这些资源并不足以抵消控制 AI 发展的大公司投入的数百亿美元。鉴于硬件方面的限制,这可能是首个大型软件范式,在现有组织之外的聪明和有创造力的工程师都无法打破它。
软件正在以越来越快的速度“吞噬着世界”,很快将随着人工智能的加速而指数增长。当前情况下,所有这些“蛋糕”都流向了科技巨头,而最终用户,包括政府和大型企业,则更加受制于它们的权力。
所有这一切发生在一个极不合适的时机——90%的去中心化网络参与者都在忙着追求由叙事驱动的轻松法币收益的“金蛋”。
开发人员正跟随我们行业的投资者,而不是反过来。这种情况有各种表现形式,从公开承认到更微妙的潜意识动机,但叙事和围绕它们形成的市场驱动了 Web3 中许多决策。和传统反射泡沫一样,参与者太过专注于内部世界,无法注意到外部世界,除非这有助于进一步推动这一周期的叙事。而人工智能显然是最大的叙事,因为它本身正处于蓬勃发展的阶段。
我们与人工智能和加密货币交叉领域的数十个团队进行过交流,可以确认他们中的许多人都是非常有能力、以使命为导向且充满激情的建设者。但人的本性就是如此,在面对诱惑时,我们往往会屈服于它们,然后在事后将这些选择合理化。
易于流动性的路径一直是加密行业的历史诅咒——目前在这一点上,它已经拖延了多年的发展和有价值的采用。它甚至让最忠实的加密货币信仰者也转向 “拉高代币”的方向。合理化的理由是,持有代币的建设者可能会有更好的机会。
机构资本和散户资本的低复杂性为建设者提供了机会,让他们可以脱离现实提出主张,同时还能从估值中获益,就好像这些主张已经实现了一样。这些过程的结果实际上是根深蒂固的道德风险和资本破坏,很少有这样的策略能在长期内起效。需求是一切发明之母,当需求消失时,发明也就消失了。
这种情况发生的时机简直不能再糟糕。当所有最聪明的科技企业家、国家行为者和大小企业都在竞相确保从人工智能革命中分得一杯羹时,加密货币的创始人和投资者却选择了 “快速 10 倍”。而在我们看来,这才是真正的机会成本。
鉴于上述的激励机制, Web3 人工智能项目的分类实际上可以分为:
从根本上说,我们认为项目建设者应该清楚地知道如何能跟上他们的 Web2 竞争对手,并且知道哪些领域是可以竞争的,哪些是痴心妄想,尽管这些痴心妄想的领域可能会向风险投资公司和公众推销。
我们的目标是能够在此时此地参与竞争。否则,人工智能的发展速度可能会把 Web3 甩在后面,而世界则会跃升到西方企业人工智能与中国国家人工智能之间的 “ Web4 ”。那些不能够及时具备竞争力并依赖分布式技术在更长时间范围内追赶的人过于乐观,不足以受到认真对待。
显然,这只是一个非常粗略的概括,即使是 “造假者 ”群体中也至少有几个认真的团队(也许更多的只是妄想者)。但这篇文章是一篇呼吁书,因此我们无意客观,而是呼吁读者要有紧迫感。
合理的:
开发“人工智能上链”中间件的解决方案创始人不多,他们明白目前去中心化训练或推理用户实际需要的模型(即尖端技术)是不可行的,甚至是不可能的。
因此,找到一种方法将最佳的中心化模型与链上环境连接起来,让其从复杂的自动化中受益,对他们来说是一个足够好的第一步。目前,可以托管 API 访问点的硬件隔离 TEE (“空气隔离”处理器)、双向预言机(用于双向索引链上和链下数据)、以及为代理提供可验证的链下计算环境的协处理器架构,似乎是目前最好的解决方案。
还有一种使用零知识证明( ZKPs )对状态变化进行快照(而不是验证完整计算)的协处理器架构,我们认为中期内也是可行的。
对于同样的问题,更理想化的方法是尝试验证链下推理,以使其在信任假设方面与链上计算保持一致。
我们认为,这样做的目标应该是让人工智能在一个统一的运行环境中执行链上和链下任务。然而,大多数推理可验证性的支持者谈论的是“信任模型权重”等棘手的目标,这些目标实际上在几年内(如果有的话)才会变得相关。最近,这个阵营的创始人开始探索替代方法来验证推理,但最初都是基于 ZKP 的。虽然很多聪明的团队正在开展 ZKML (即零知识机器学习)的研究工作,但他们预计加密优化的速度会超过人工智能模型的复杂性和计算要求,冒了太大的风险。因此,我们认为他们目前不适合竞争。不过,最近的一些进展还是很有趣的,不应该被忽视。
半合理的:
消费者应用程序使用封装了闭源和开源模型的包装器(例如,用于图像生成的稳定扩散或 Midjourney )。其中一些团队率先进入市场,并获得了实际用户的认可。因此,一概称其为造假者并不公平,但只有少数几个团队正在深入思考如何以去中心化的方式发展其底层模型,并在激励设计方面进行创新。在代币部分,也有一些有趣的治理/所有权设计。但是,这类项目中的大多数只是在诸如 OpenAI API 的基础上,在原本中心化的包装上打上一个代币,以获得估值溢价或为团队带来更快的流动性。
上述两个阵营都没有解决的问题是去中心化环境下大型模型的训练和推理。目前,如果不依靠紧密连接的硬件集群,就无法在合理的时间内训练出基础模型。鉴于竞争水平,“合理的时间 ”是关键因素。
最近已经有一些有前途的研究成果,从理论上讲,“微分数据流”( Differential Data Flow )等方法将来可能会扩展到分布式计算网络,以提高其容量(随着网络能力赶上数据流要求)。但是,有竞争力的模型训练仍然需要本地化集群之间的通信,而不是单一的分布式设备和尖端计算(零售 GPU 越来越缺乏竞争力)。
通过缩小模型大小来实现本地化推理(去中心化的两种方法之一)的研究最近也取得了进展,但在 Web3 中还没有利用它的现有协议。
去中心化训练和推理的问题逻辑上将我们带到了三个阵营中的最后一个,也是迄今为止最重要的一个,因此对我们来说是最具情感触发性的一个。
造假的:
基础设施应用主要集中在分散服务器领域,提供裸硬件或分散模型训练/托管环境。还有一些软件基础设施项目正在推动联盟学习(分散模型训练)等协议,或者那些将软件和硬件组件结合到一个平台的项目,在这个平台上,人们基本上可以端到端地训练和部署他们的去中心化模型。它们中的大多数都缺乏实际解决所述问题所需的复杂性,“代币激励+市场助力 ”的天真想法在这里占了上风。我们在公共和私人市场上看到的解决方案,没有一个能在此时此地实现有意义的竞争。有些方案可能会发展成为可行的(但小众的)产品,但我们现在需要的是新鲜的、有竞争力的方案。而这只能通过解决分布式计算瓶颈的创新设计来实现。在训练中,不仅速度是一个大问题,已完成工作的可验证性和培训工作负载的协调也是一个大问题,这就增加了带宽瓶颈。
我们需要一套有竞争力的、真正去中心化的基础模型,它们需要去中心化的训练和推理才能发挥作用。失去人工智能可能会彻底否定自以太坊出现以来 “去中心化世界计算机 ”所取得的一切成就。如果计算机变成了人工智能,而人工智能又是中心化的,那么除了某种反乌托邦式的版本之外,世界计算机将无从谈起。
训练和推理是人工智能创新的核心。当人工智能世界的其他领域都在向更紧密的架构发展时, Web3 需要一些正交的解决方案来与之竞争,因为正面竞争的可行性正变得越来越低。
一切都与计算有关。对训练和推理的投入越多,结果就越好。是的,这里可能会有一些调整和优化,那里也可能有一些调整和优化,计算本身并不是同质的。现在有各种各样的新方法来克服传统冯-诺依曼架构处理单元的瓶颈,但这一切仍然归结为你能在多大的内存块上做多少次矩阵乘法,速度有多快。
这就是为什么我们会看到所谓的 “超大规模 ”在数据中心方面进行如此强大的建设,它们都希望创建一个完整的堆栈,顶部是人工智能模型,底部是为其提供动力的硬件: OpenAI (模型)+微软(计算)、 Anthropic (模型)+ AWS (计算)、谷歌(两者都有)和 Meta (通过加倍努力建设自己的数据中心,两者都越来越多)。还有更多的细微差别、相互作用动态和相关方,但我们就不一一列举了。总的来说,超大规模企业正在前所未有地投资数十亿美元用于数据中心建设,并在其计算和人工智能产品之间创造协同效应,随着人工智能在全球经济中的普及,预计将产生巨大的收益。
让我们来看看这 4 家公司仅在今年的预期建设水平:
英伟达TM( NVIDIA ®)公司首席执行官黄仁勋( Jensen Huang )曾提出,未来几年将向人工智能加速领域投入总计 1 万亿美元的资金。最近,他将这一预测翻了一番,增加到 2万美元,据称这是因为他看到了主权企业的兴趣。
Altimeter 公司的分析师预计,2024 年和 2025 年全球与人工智能相关的数据中心支出将分别达到 1600 亿美元和 2000 多亿美元。
现在,将这些数字与 Web3 为独立数据中心运营商提供的激励进行比较,以促使它们在最新的人工智能硬件上扩大资本支出:
当前,所有去中心化物理基础设施( DePIn )项目的总市值目前约为 400 亿美元,主要是由相对流动性较低且以投机为主的代币构成。基本上,这些网络的市值等于其贡献者的总资本支出的上限估计,因为它们用代币来激励这种建设。然而,当前的市值几乎没有用处,因为它已经发行了。
因此,让我们假设在未来 3-5 年内,作为激励措施,市场上还会出现另外 800 亿美元(现有价值的 2 倍)的私有和公开 DePIn 代币资本,并假设这些代币将 100% 用于人工智能用例。即使我们将这一非常粗略的估计除以 3(年),并将其美元价值与仅在 2024 年投入的超大规模公司的现金价值进行比较,很明显,将代币激励措施强加给一堆 “去中心化 GPU 网络 ”项目是不够的。
此外,还需要数十亿美元的投资者需求来吸收这些代币,因为这些网络的运营商将大量挖出的代币出售以支付资本和运营支出的重大成本。还需要更多的资金来推动这些代币的上涨,并激励扩大建设,以超越超大规模公司。
然而,对 Web3 服务器目前的运行方式有深入了解的人可能会认为,“去中心化物理基础设施 ”的很大一部分实际上是运行在这些超大规模公司的云服务上。当然, GPU 和其他人工智能专用硬件需求的激增正在推动更多的供应,这最终会使云租赁或购买变得更加便宜。至少这是人们的期望。
但同时也要考虑到:现在英伟达需要优先考虑客户对其最新一代 GPU 的需求。英伟达也开始在自己的地盘上与最大的云计算提供商展开竞争——向已经锁定在这些超级计算器上的企业客户提供人工智能平台服务。这最终会促使它要么随着时间的推移建立自己的数据中心(实质上会侵蚀他们现在享受的丰厚利润,因此不太可能),要么将其人工智能硬件销售大幅限制在其合作网络云提供商的范围内。
此外,正在推出额外人工智能专用硬件的英伟达竞争对手,大多使用的是由台积电生产的与英伟达相同的芯片。因此,目前基本上所有人工智能硬件公司都在争夺台积电的产能。台积电也需要优先考虑某些客户。三星和潜在的英特尔(英特尔正试图尽快重返最先进的芯片制造领域,为自己的硬件生产芯片)或许能够吸收额外的需求,但台积电目前正在生产大多数人工智能相关芯片,而对尖端芯片制造(3和 2 纳米)的扩展和校准需要数年时间。
最后,由于美国对英伟达( NVIDIA )和台积电( TSMC )的限制,中国基本上与最新一代人工智能硬件无缘。与 Web3 不同,中国公司实际上也有自己的竞争模式,尤其是百度和阿里巴巴等公司的 LLM ,它们需要大量上一代设备才能运行。
由于上述原因之一或各种因素的迭加,随着人工智能争霸战愈演愈烈并优先于云业务,超大规模企业会限制外部访问其人工智能硬件,这是一种非实质性风险。基本上,这是这样一种情况:他们将所有与人工智能相关的云容量都占为己有,不再提供给其他人,同时还吞噬了所有最新的硬件。这样一来,包括主权国家在内的其他大公司就会对剩余的计算供应提出更高的要求。与此同时,剩下的消费级 GPU 也越来越缺乏竞争力。
显然,这只是一个极端的情况,但如果硬件瓶颈依然存在,大玩家们就会因奖金过高而退缩。这样一来,像二级数据中心和零售级硬件所有者这样的去中心化运营商(占 Web3 DePIn 提供商的大多数)就会被排除在竞争之外。
当加密货币的创始人还在睡梦中时,人工智能巨头们正在密切关注加密货币。政府的压力和竞争可能会促使他们采用加密货币,以避免被关闭或受到严格监管。
Stability AI 创始人最近辞职,以便开始 “去中心化 ”他的公司,这就是最早的公开暗示之一。他此前在公开露面时并没有隐瞒他计划在公司成功上市后推出代币,这在某种程度上暴露了预期行动背后的真正动机。
同样,虽然 Sam Altman 并没有参与他联合创立的加密项目 Worldcoin 的运营,但其代币的交易无疑就像是 OpenAI 的代理。是否存在一种将互联网代币项目与人工智能研发项目联系起来的途径,只有时间会告诉我们,但 Worldcoin 团队似乎也意识到市场正在测试这一假设。
对我们来说,人工智能巨头们探索不同的去中心化路径是非常有意义的。我们在这里再次看到的问题是, Web3 并没有产生有意义的解决方案。“治理代币”大多数时候只是一个梗,而目前只有那些明确避免资产持有者与其网络开发和运营之间直接联系的代币,如 BTC 和 ETH ,才是真正的去中心化代币。
导致技术发展缓慢的激励机制也影响了不同治理加密网络设计的发展。初创团队只是在自己的产品上贴上一个 “治理代币”,希望在蓄势待发的过程中摸索出一条新路,而最终却只能在围绕资源分配的 “治理剧场 ”中固步自封。
AI 竞赛正在进行,每个人都对此非常认真。在大型科技巨头扩展计算能力的思考中,我们无法找到任何漏洞——更多的计算意味着更好的人工智能,更好的人工智能意味着降低成本、增加新收入和扩大市场份额。对我们来说,这意味着泡沫是合理的,但所有的造假者仍将在未来不可避免的洗牌中被淘汰。
集中化的大企业人工智能正在主导这个领域,初创企业很难跟上。 Web3 领域虽然姗姗来迟,但也正在加入这场竞争。与 Web2 领域的初创公司相比,市场对加密人工智能项目的奖励过于丰厚,这使得创始人在关键时刻将注意力从产品交付转向了推动代币价格上涨,而这一时机正在迅速关闭。到目前为止,还没有任何创新能够规避扩展计算规模以进行竞争。
现在,围绕面向消费者的模型,出现了一场可信的开源运动,最初,只有一些集中式企业选择与更大的闭源对手(如 Meta 、 Stability AI )争夺市场份额。但现在,社区正在迎头赶上,给领先的人工智能公司带来了压力。这些压力将继续影响人工智能产品的闭源开发,但在开源产品迎头赶上之前,影响不会很大。这是 Web3 领域的另一大机遇,但前提是它必须解决分散模型训练和推理的问题。
因此,虽然从表面上看,“经典 ”的颠覆者机会是存在的,但实际情况却远非如此。人工智能与计算息息相关,如果未来 3-5 年没有突破性创新,就无法改变这一现状,而这正是决定由谁控制和引导人工智能发展的关键时期。
计算市场本身,尽管需求推动了供应方的努力,但由于制造商之间的竞争受到芯片制造和规模经济等结构性因素的制约,也不可能 “百花齐放”。
我们仍然对人类的聪明才智持乐观态度,并确信有足够多的聪明人和高尚的人可以尝试以一种有利于自由世界,而非自上而下的企业或政府控制的方式来破解人工智能难题。但是,这种机会看起来非常渺茫,充其量也就是掷硬币而已,但 Web3 的创始人却忙于掷硬币来获得经济效益,而不是对世界产生实际影响。