挖掘矿机剩余算力：分布式机器学习的利用

时间：2023-08-04|浏览：196

近十年来，由于机器学习技术的进步和硬件加速的推动，对人工智能的需求大幅增长。然而，为了提高预测质量并适应更复杂的应用，需要大量的训练数据和计算资源。

由于训练数据处理需求超过了单台计算机的能力，需要将机器学习工作分散在多台机器上，从而将集中式系统转变为分布式系统。随着机器学习技术的发展，训练数据集的数量越来越多，这将在分布式存储市场中创造更多的价值。同时，庞大的模型训练是否能够利用矿机的剩余算力也是一个问题。不管是从网络存储和检索角度，还是从矿工收益角度，去中心化存储市场的整体经济盈余都会大幅增长。

该文从机器学习的角度探讨了分布式存储在分布式机器学习中的优势，以及它对分布式存储的价值。

分布式机器学习是什么？近年来，由于技术的快速发展，数据量达到了前所未有的高度。在数据分析和决策系统中，机器学习算法的应用日益广泛，但对于某些复杂问题，单一的机器学习算法无法解决。例如自动驾驶、语音识别、量化预测和消费行为预测等。

总的来说，机器学习问题可以分为训练阶段和预测阶段。在训练阶段，通过向机器学习模型输入大量的训练数据，不断地更新优化该模型。在预测阶段，将新的数据让训练好的模型输出预测结果。这可以用下图表示：

考虑到复杂应用的训练集很容易达到TB级，为了减少训练时间，人们将机器学习方法应用于分布式系统，充分利用并行处理和I/O总带宽的优势。如果数据本身是分布式的，或者数据量太大无法存储在单一设备上，传统的中央模式就无法满足需求。

在将这类数据集作为机器学习模型的训练数据时，我们需要选择能进行并行或分布式计算和数据分布式存储的算法。解决机器学习问题的分布式方案可以分为数据分布和模型分布两种方法，将问题分解到多个设备之间（这两种方法也可以同时使用）。

在分布式系统中，节点数量决定了数据块的大小，因此所有节点使用相同的算法。同一模型可供所有节点使用（通过集中分布或复制分布），因此聚合后会得到与传统机器学习训练一致的结果。这种方法适用于现有的任何机器学习算法，只要数据的分布是独立且同分布。

对于模型分布式，将模型分解为不同的组件，每个节点接受一个或多个组件的请求，然后将整个数据集作为输入进行训练。换句话说，每个节点都要处理相同的数据，并最终形成一个聚合的最终模型。由于模型参数通常不能分割，所以模型分布式方法并不适用于所有机器学习算法。

下一步，我们将通过具体示例来探索机器学习和分布式存储网络的结合。

深度学习主要依靠数据表征而非特定任务的算法。在深度学习中，“深度”一词用于描述模型输入和输出之间的层次关系。这两层将数据转换为各种表示，并给出结果。迁移学习提供了一种新的深度学习方法。

迁移学习通过学习和解决一系列问题，存储和积累所获得的知识，并试图将这些知识应用于其他类似的问题。在算法上，它类似于将识别鸟类的知识应用于飞机和其他飞行物体的识别。常规机器学习使用来自同一领域的数据进行学习和预测，而迁移学习使用来自其他领域的知识（例如，从其他模型中预先训练的权重）来完成目标领域的任务。

我们可以构建一个区块链框架，将深度学习模型进行数据预训练并在其上实施智能合约。当满足智能合约的限定条件（例如支付通证）时，这个合约可以通过网络共享给其他用户，从而使模型更广泛地使用——使用预先训练好的大数据模型来处理用户自己的小数据模型。

在这个框架中，区块链提供的不仅仅是一种通信机制，还是一种知识产权保护制度。在区块链上的智能合约可以确保预先训练的模型或创建模型的人拥有这些知识产权（模型、数据和资源），并且分享数据的个人可以获得报酬，从而推动这种“机器知识”的传播。

Filecoin开发团队一直强调存储“价值数据”的重要性，从Filecoin网络测试阶段开始，他们就开始研究如何让“价值数据”的存储节点获得更高的效率。自从2021年1月FilecoinPlus正式开始Datacap分配过程以来，验证客户机所分配的Datacap数量很少，其中一个原因是由于公证人进行人工审核的时间周期较长，并且没有发现大量可信客户机的释放。按照目前的规则，在Filecoin网络上存储机器学习训练集或模型等有意义的数据时，矿工理想情况下可以

« 上一条| 下一条 »