金工 | 高频数据下基于文本挖掘和深度学习的股票波动性预测
本文摘要
在开发量化投资策略时,海外优秀论文往往能够提供新的思路和方法,为了能够让各位投资者更有效率地吸收海外的经验,东兴金工团队推出海外文献速览系列报告。我们将定期从海外文献中筛选思路较为新颖且有潜力应用于国内市场投资的文章,以速览的形式呈现给各位投资者,内容涵盖资产配置、量化选股、基金评价以及衍生品投资等多个方面。
本篇报告作为该系列报告的第十六篇,我们选取了Bolin Lei, Zhengdi Liu, Yuping Song的文献《On stock volatility forecasting based on text mining and deep learning under high-frequency data》。
金融资产价格的波动在衡量资产风险水平和衍生品定价方面发挥着极其重要的作用。因此,基于波动性特征发现更多预测指标和模型对于分析金融资产风险具有非常重要的理论意义和实用价值。
本文是一篇有关基于深度学习对波动率预测的新兴文献。深度学习在股票市场的应用是一个热门的学术研究领域。尽管在美国市场的研究已经很多,但深度学习方法在中国市场的应用能力仍然有待验证。作者认为深度学习模型的非线性关系拟合能力和强大的数据特征学习能力,为提高波动率预测的准确性提供了新思路。
很少有文献使用包含公众意见的文本信息作为波动率预测的输入指标。作者利用股东的文本评论信息构建了一个文本情绪因子,整合了评论的影响,然后结合波动率预测的其他交易信息,以高频金融数据为基础,采用了深度学习模型长短期记忆(LSTM)进行构建波动率预测模型。作者发现,带有情绪指标的LSTM模型对波动率的预测准确率优于没有情绪指标的LSTM模型,并且与六种损失函数下的10个传统计量经济学模型的多步骤预测相比时,LSTM模型是更稳健的。随着民意指标的加入,LSTM的准确率在六个评价标准MSE、RMSE、MAE、MSLE 、R^2和RMSPE下分别提高了9.3%、4.7%、6.2%、9.2%、7.9%和16.9%,表明股东情绪指标对市场股票股价波动率预测有正向影响。窗口长度的选择也对LSTM模型预测的准确性有一定的影响,若窗口时间过小,模型则无法获得足够的数据,若窗口时间过大,数据集会采集到过多的无关数据,影响模型的训练效率,从结果上看,窗口值为20时,模型可以达到最优的效果。作者的研究过程和结论提供了一个构建更准确、更稳健的波动率预测模型的新方法,深度学习和文本挖掘技术也被应用到金融时间序列分析中。
风险提示:本报告内容来源于相关文献,不构成投资建议。文中的结果基于原作者对历史数据的回测,当市场环境发生变化的时候,存在模型失效的风险。
本文目录
分析师:高智威,S1480521030002,0755-82832012
研究助理:贺争盛,S1480121070099,18768114667
如需完整版报告请与东兴证券研究员或对口销售联系
本文节选自东兴证券研究所已于2022年3月9日发布的《高频数据下基于文本挖掘和深度学习的股票波动性预测——海外文献速览系列之十六》,具体分析内容(包括风险提示等)请详见报告。若因对报告的摘编产生歧义,应以完整版报告内容为准。
向 下 滑 动 查 看 完 整 法 律 申 明
分析师承诺:
负责本研究报告全部或部分内容的每一位证券分析师,在此申明,本报告的观点、逻辑和论据均为分析师本人研究成果,引用的相关信息和文字均已注明出处。本报告依据公开的信息来源,力求清晰、准确地反映分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。
风险提示:
本证券研究报告所载的信息、观点、结论等内容仅供投资者决策参考。在任何情况下,本公司证券研究报告均不构成对任何机构和个人的投资建议,市场有风险,投资者在决定投资前,务必要审慎。投资者应自主作出投资决策,自行承担投资风险。
免责声明:
本研究报告由东兴证券股份有限公司研究所撰写,东兴证券股份有限公司是具有合法证券投资咨询业务资格的机构。本研究报告中所引用信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。
我公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。本报告版权仅为我公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为东兴证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。
本研究报告仅供东兴证券股份有限公司客户和经本公司授权刊载机构的客户使用,未经授权私自刊载研究报告的机构以及其阅读和使用者应慎重使用报告、防止被误导,本公司不承担由于非授权机构私自刊发和非授权客户使用该报告所产生的相关风险和责任。