时间:2021-04-05|浏览:1798
十五年前,我逐渐探寻虚拟货币的全球,并建立了一个只应用SMS的点到点的挪动贷币服务平台。
我的一个合作方近期跟我说人工智能技术能不能预测分析数字货币的价钱。她对区块链技术的宣传策划觉得好奇心。
根据科学研究,我发现了,预测分析数字货币的价钱是个能够 处理的难题,但它并不是对于全部销售市场状况。
一个典型性的数据加密财产预测模型将应用时间序列分析预测分析(如ARIMA,FacebookProphet),深度学习(如随机森林优化算法,线性回归),或是深度神经网络方式(如LSTM)。
本文科学研究了在给出日期预测分析Litecoin均价时,按段内插的实际效果。
在2013年4月至2021年2月期内,大家会关心Litecoin的历史价格查询。该数据信息来自于coinmarketcap,可供免费试用。把数据信息分为80%的训炼数据和20%的数据测试集。后一种方式用于评定大家预测分析的收盘价格。
AI能预测分析数字货币的价钱吗?
Litecoin数字货币的价格历史(Source:Kaggle)
短期内探究性数据统计分析说明,今年初和年底的均值收盘价格最大。
多项式回归法
大家或许听闻过多项式回归,它是创建根据d的阶次类似的非线性函数(在大家的事例中,数字货币价钱起伏)的非常简单的事例。
针对Litecoin,我就用5、25和80的级别对历史价格查询开展了简易的多项式回归。每一次,R2值都是会在数据测试集在出示相关实体模型合乎或不符实体模型的一些信息内容。
由下列绿线对训炼数据信息的拟合程度能够 看得出,曲线图伴随着代数式的提升而变陡。因为高级代数式尝试跟踪训炼集中化的每一个单一数据信息点,因而提升了实体模型的多元性。
2013年4月30日为0天,2021年2月28日为2800天。
特别是在在存有出现异常值的地区,高级代数式趋向于向出现异常值发展趋势。结果显示,80次代数式实体模型标准差较大。
与之对比,低级代数式中的R2值较低,表明较高的误差,但标准差较小,因而对训炼数据信息的危害也较小。低等代数式对训炼数据信息不比较敏感。
内置式插值法
我发现一种更灵便的方式,便是应用按段代数式预测分析数字货币的价钱。
选用低级多项式拟合片段插值法中很多数据信息点。由于大家只应用低级代数式,因此 大家清除了不收敛性和过振。
得出一组数据信息点,分块插值法便是根据对各一部分数据信息应用不一样的代数式来开展。
从总体上,大家应用了联接分块代数式,也叫样条。
下边的断开线性函数便是一个样条实例。4左侧的是平的,称为涵数的节点。
为发觉数字货币价钱中存有的高宽比曲线图关联,大家应用了一种断开三次函数,也称之为三次样条。
运用三次样条,大家把数据信息分为好多个块,每一个块相匹配一个三次样条。每一个样条涵数都联接到下一个连接点上。
因为联接是光滑的,因此 三次样条是数字货币价钱转变 的非常好的挑选。三次样条的切线斜率以及第一和第二导函数均相符合。三次样条是一个代数式的3阶涵数,它依然不大,能够 防止出现差别。
三阶样条是三次样条的一种较简易的组合,它能够 合理地开展测算,由于数最多五个基函数参加了奉献插值法。下面的图是B-样条在Litecoin价钱上的三次主要表现,在四分位后再加上节点。
在我们有着一组数据信息点时,根据手工制作挑选节点,与根据四分位数置放节点时的值对比,我们在数据测试集中化得到了更强的R2。
三次样条挨近界限的时候会看起来很怪异,你能在上面鲜红色的数据图表中注意到。当然三次样条法根据将一个三次代数式在每一个极限点上变成线形,强制性涵数在极限点之外为线形。
纯天然的三次样条曲线必须随意选择。就Litecoin的价钱来讲,我根据交叉验证找到最佳可玩性:挑选适合的174个连接点的量子科技做为预测分析日期。试验说明,与三次B-样条曲线对比,该曲线图边沿差异较小,R2差一些。
最后完成了光滑样条,在降到最低均方误差的另外对价钱的转变 开展了处罚。
光洁样条可能是最合适Litecoin价钱的分块插值法方式。这一实体模型在数据测试集在完成了最佳的R2值。
三次样条实体模型最振奋人心的地区取决于,它超过了用于训炼实体模型的数据信息开展推理。
RobJhyndman是一位知名的遗传学家,他科学研究了时间序列分析预测分析方式,他强调,三次光洁样条实体模型在预测分析上与ARIMA实体模型是等额的的,可是主要参数室内空间比较有限。罗布觉得样条实体模型出示了光洁的历史时间发展趋势和线形预测分析涵数。