当前位置:首页 股票学习 正文

用机器学习预测股票用AI炒股机器人量化分析、量化投资、股票量化学习篇章

laughing168 2022年02月11日 162 0

原标题:用机器学习预测股票,用AI股票交易机器人,量化分析,量化投资和股票量化学习章节

机器学习的普及是前所未有的。它广泛应用于基于数据的决策领域,以及投资领域。只需在谷歌中同时搜索“机器学习”和“股票预测”,就可以获得大量关于时间序列预测和递归神经网络的信息。虽然股票价格是由公共搜索机器人量化的,对于这样的算法来说,这是一个极好的数据选择,但我们仍然应该谨慎,尤其是在钱的问题上。

可以清楚地看到,机器学习(或数据科学)将技术技能(如编程和数学)与各个领域的专业知识相结合。没有这三种形式的共同呈现,我们只能回到其中一个纯粹的领域。

这个描述特别适用于金融领域的机器学习。时间序列财务数据非常微妙,利用现成的算法处理未经处理的价格数据,是发现错误、防止资金损失的好方法。因此,在使用这些数据时,需要注意一些特殊的事项,尤其是行业知识的应用。

基于此,本文致力于提供一些常被新人忽视的直观事实。由于与数学和编码相关的可用资源已经非常丰富,本文主要集中讨论这个问题。

也许这并不奇怪,因为数据是任何机器学习模型的重要组成部分,股票预测也不例外。首先,我们需要了解数据生成的过程,然后我们才能知道为什么我们需要如此谨慎。通常被分析领域的股票预测数据集是时间序列数据,如宏观经济数据、基础数据、价格数据等。这类数据存在序列相关现象。简而言之,每个观测值都是基于前一个时间间隔的观测值。

为了在实践中说明这一点,以价格为例。如果我们观察任何一只股票,跟踪它的日价格走势,我们会发现,除了一些“小”偏差,每只股票的收盘价都与前一天的收盘价紧密相连。

这是为什么?简单来说,股票就是企业所有权的份额,它的价值是由永恒的会计等式决定的,即资产减去负债等于股东权益。它是股价主体的基本企业价值,而投资者情绪、交易行为和噪声影响日偏差值。企业资产,即机器、土地、建筑物和存货的价值不会在一夜之间发生巨大变化,大多数负债也会发生巨大变化。如果没有财务丑闻,企业整体基本价值相对稳定。

这对机器学习意味着什么?意思是模型可以和亏损函数进行博弈,选择前一天的股价作为今天价格的预测值,从而很好地完成工作。当很多“优秀预测模型”的预测输出曲线接近实际股价滞后的移动平均线时,这一点就可以明显看出。任何这样的模式都在不断接近实际价格。

平稳性问题也有类似的特征。许多机器学习模型和预处理技术都假设生成数据的分布参数是恒定的。换句话说,特征的均值和标准差不随时间变化,数据也没有趋势。但是,只要看看美国长期使用的季度GDP数据,你很快就会打消这个念头。这些数据显然有一个趋势,所以如果一个经济体在增长,可以预期它的产量和价格会随着时间的推移而增加。

数据的均值和标准差随时间变化,这也给回归分析等算法以及标准化、主成分分析等预处理技术的盲目应用带来了一定的不便。

在(投资)文献和实践中,防止时间序列异常情况的常用方法是选择两个时间段之间的股价收益率(或其他数据变化率),而不是取绝对值。其背后的规律与ARIMA时间序列预测中的趋势去除和微分差分非常相似,目的是保持数据稳定。如果我们将这种方法应用于美国的GDP数据,我们将得到类似于常规id变量的结果。

大多数有监督的机器学习方法是通过估计或优化一组最小化目标函数的权重来制定的。在回归分析中,这个函数通常是均方根误差(RMSE),在分类上属于交叉熵。对于像ILSVRC这样的经典基准数据集来说,这已经变成了“自下而上的竞争”,高层团队也在年复一年地大幅降低出错率。虽然这对于学术研究有一定的价值意义,但过分追求减少任意错误也导致对现实世界中一些迫切问题的更多抽象。

在投资领域,找一个准确率95%的模型来分类什么时候买入或者卖出股票是非常好的。但通常,这种模型不会模拟真实的投资组合行为,最重要的是,它不会考虑错误的成本。市场瞬息万变。虽然看似有利的投资环境可能会持续多年,但调整变化或“黑天鹅事件”(Naseem Taleb提出的一个概念,即不可预测、不寻常的事件)随时都有可能发生。

如果任何代表5%错误率的事件与罕见但灾难性的事件同时发生,那么你的投资组合肯定会受到影响,甚至95%正确率的累计值也将不复存在(假设没有泛化错误)。这个问题对于职业投资经理来说更为严重,因为10%的减持就足以导致投资者大规模离开基金。而收益和投资不对称的影响也深深扎根于经验丰富的从业者的头脑中,这也解释了为什么这个行业既注重收益创造,又注重风险管理。

这里向机器学习者和数据科学家介绍,微信官方账号机器人对这些知识进行量化,是为了帮助他们更深入地理解模型背后的含义,摆脱只被告知错误率和损失函数,进行向前行走测试。这就像随着时间的推移保持预期的交易,并采取成本敏感的措施来惩罚模型错误。

要理解机会成本的概念,仅有一个能盈利的机器学习模型远远不够。机会成本是一个重要的经济学原理,解释了放弃次优投资机会的成本。

总结:如果提出的机器学习模型v,lai2021四个八不用于投资,那么次佳机会,微众机器人量化,也是一个不需要太多技巧的机会,即买入交易所交易基金增加市场份额。这些产品可以让你以相对较低的成本获得标准普尔500等指数级别的回报。因此,我们必须思考一个问题。如果模型在调整交易成本后的表现,并没有明显超过标普500指数历年至今18.74%的收益率表现,那么你真的做了明智的金融投资吗?

职业投资经理总是受制于某个基准,在这个基准下,他们的技能是以超越基准的能力来衡量的,而机器学习者和数据科学家则没有类似的基准来衡量他们的财务预测能力。回搜狐多看看。

本文地址: http://www.fadun365.com/jinrong/105148.html

文章来源:laughing168

版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

置顶
置底