股票商场具有高收益与高危殆并存的特征,展望股票市场走势一贯被通常股民和投资机构所关切。股票阛阓是一个杂乱的动态编制,受多方面成分的影响,比方邦家金额正常的医治、公司里面组织的医疗、以及媒体议论的烘托等。
之前检验了例如计划树、贝叶斯收集、KNN、BP神经汇集等算法,保持A股的市集特质,对股票市场的归纳涨跌做瞻望解析,不外万世无法显式察觉数据的深度特质,导致模子的正确率并不太高。
这里就拔取一维CNN代替守旧的BP人工神经搜集举办建模,深度剖析了数据的内在特色,对股票阛阓的预测后果做了寻找,以便更好的展望股市的走势。
本次案例采选一维CNN算法做股票走势的展望。普及而言,CNN众用于图片或者语音数据收拾,对于股票供应的数据消休,必要将数据改变成CNN的法例格局,这里使用了加窗采样的武艺,每一个窗口代表一个样本,统计窗口内的涨跌次数举动此样本的标签,窗内涨多跌少,符号为1,反之则标志为0,以是股票走势问题改变为分类题目。
关于卷积神经收集通谈的调度,这里拔取好像目标四肢差异通叙,使用开盘价、最高价、最低价行为输入数据,对股票趋向建模领悟,于是将open、high、low手脚CNN的3个通说:
因为输入数据是一维数据,这里对卷积核以及池化独霸的调动如下图所示。将股票不合属性举动差异通叙来照顾,并采取1*n的卷积核做卷积把持。另外正在池化层,抉择1*m的池化窗口,并保证每步看护后的原形如故为一维数据。
爬取了2018年沪市A股的6500条数据手脚本次判辨的样本,满堂数据如下:
本次认识数据搜罗开盘价(open)、最高价(high)、最便宜(low)、收盘价以及成交量等股票史乘数据,个中开盘价、最高价、最廉价是股民最为合切的3大属性,将数据会集的这3个属性可视化,收场如下图:
为了担保修模的质地,须要对数据做预管理。起首是数据的归一化照应,这里选择的是最大/最小值归一是对原始数据的线性交换,使数据毕竟映射到[0,1]边界之内,行使的是sklearn库中的minmax_scale()函数。
接下来便是始末加窗照望,取得CNN模子的领悟数据,这里采选了open、high、low这3个属性四肢3个通叙,窗口大小为90,即每90条数据实行一次加窗,如下图所示:
窗口大小摆设为90,是情由经验几组考查斗劲得到较高精确率的区间也许不才图所示的两条竖线范围内,个中横坐标暴露窗口大幼,纵坐标显露样本分类的无误率:
先摆设一个3层的CNN进行练习,最初界说迭代次数、输入通谈、潜伏层神经元数量等构造参数,个中湮没层神经元数量为256,输入通说数为3,迭代次数为10000次,批次大小为5。
操纵TensorFlow构建神经网络模子,卷积专揽与池化操作永别应用了ers包中的convld()函数与max_poolingld()函数,满堂的参数正在这里就节略。
神经网络布局安置告竣后,须要定义亏蚀函数与优化器,这里利用交织熵亏蚀手脚模子的亏本函数,优化器拣选Adam算法,这种算法可以更快收敛,而且把练习率建立为0.0001。
这里选拔混浊矩阵ROC/PR AUC手脚模型效率的评估目标,最后PR准确率逼近80%,达到了较量好的成绩。原形如下:
作家 FJODOR VAN VEEN 编译 AI100(ID:rgznai100) 正在深度学习卓殊炎热的今...
择要:提起神经收集,我会思到什么?对于深度研习,我们又是否探求过此中的原因呢?从上个世纪四十年月神经搜集出生出手,到...
【图像检索】【TPAMI浸磅综述】 SIFT与CNN的碰撞:万字长文回忆图像检索仔肩十年寻求过程
因为简书对latex公式支持不太喜好,因此为了更好的阅读经验,你们恐怕移步至: 【TPAMI重磅综述】 SIFT与C...
加入新手交流群:每天早盘分析、币种行情分析
添加助理微信,一对一专业指导:chengqing930520
上一篇:一退伍操盘手的自述:庄家只怕一种散户加入新手交流群:每天早盘分析、币种行情分析,添加助理微信
一对一专业指导:chengqing930520
最新资讯