结合AlphaGo算法和大数据的量化基本面分析法探讨

  

◆ ◆ ◆

本文是以郝伯特·西蒙的过程理性理论结合AlphaGo算法步骤探讨量化基本面分析法的分析方式,而不是讨论如何使用量化基本面分析法预测公司股价。

 

量化基本面分析法(Quantamental)将量化和基本面两种方法结合起来,是近几年随着市场电子化、大数据、自然语言处理技术快速发展产生的新的基本面分析法。现在已经是DT时代,发挥海量数据价值已成为可能。以下讨论都是假设已合法的收集相关数据包括交易、消费、关注度、GPS、卫星数据等等。

 

◆ ◆ ◆

一、基于大数据的量化基本面分析法的预测更准确吗?

一般来说,我们会将整个经济看作一个大的动态市场系统,其中又会分割为一些子市场系统,可以认为每一个子市场系统中参与方与相关变量彼此之间的联系要比其他子系统中变量的联系要更强些。所以每个子市场系统中的参与方以及变量独立于其他子系统相对均衡动态移动。短期均衡及每个子系统显著主导的行为往往是波动而不可预期的。但长期动态均衡往往是可预期的,虽然每个子系统中的变量一起动态移动,但保持了每个子系统间的相对均衡。从微观角度考虑的时候现象是变化的,而从宏观角度考虑时,现象是不变的。现在基于之前的数据假设,我们有了关于各个子市场系统方方面面的数据,自然可以更好地统计长期动态均衡中那些稳定的关系,从而得到更加可靠的基本面分析结果。

但与此同时,我们也能听到另一种声音。在《信号与噪声》[1]书中,作者认为在大数据时代信息量呈指数增长,需要验证的假设也正在以同样的速度增长。数据中那些有意义的因果关系组合少之又少,增长的速度也不及信息本身的增长速度快。大多数数据都只是噪声。人们很难从干扰他们的噪声中分辨出有用的信号。数据展示给我们的通常都是我们想要的结果,而且我们通常也默认这种皆大欢喜的结果。作者纳特•西尔弗还引用莎士比亚剧作中的话“人们照着自己的意思解释一切事物的原因,实际上却和这些事物本身的目的完全相反”。更大量信息能帮助我们更准确的预测吗?

当然我们知道,通过深度学习和大数据,一定能得到一个更优的模式识别效果。但前提是我们假设未来和历史特征向量是符合同一概率分布。未来当然不会和历史是同一概率分布,就像彼得·林奇说的“你无法从后视镜中看到未来。”哈耶克也说过“我们做出的预测有可能被否定,因为他们只具有经验的意义。”这里也不想用深度学习成果来证明大数据在预测方面的效用。

纳特•西尔弗在其书中接下来说:”信息只有在恰当的环境下才会成为知识,没有环境,我们就无法从噪声中区分信号,不断犯错,不断尝试,这或许是贝叶斯定理应用起来最容易的一个原则:进行大量的预测。”[1]”贝叶斯定理告诉我们,任何时候获得新信息,我们都应该更新自己的预测。简单地说就是,不断犯错,不断尝试。真正’拥有’大数据的公司,比如谷歌公司,并不会在建立模型的问题上花费太多时间。它每年会进行上千次实验,并在真正的客户身上检验它的想法。”[1]在谷歌等互联网公司都会有完善AB测试框架,以方便不同功能快速部署AB测试,通过客户使用效果反馈不断迭代完善功能。我们知道AB测试本质上是个分离式组间实验,不断获取客户反馈既新信息持续优化模型效果。同样我们可以认为基于大数据的量化基本面分析法,不只是用大数据补充之前基本面分析法所用数据不足,其也是通过量化和更及时的数据不断修正预测模型的过程。

 

◆ ◆ ◆

二、 基于过程理性的量化基本面分析法

接下来,将以郝伯特·西蒙的过程理性理论结合AlphaGo算法步骤探讨量化基本面分析法的步骤[2][3]:

1.设想可选方案集合,以及可能后果集合。

还是基本面分析法经常需要分析的那些问题,包括上下游、销量、成本、利润、财务比率等。设想不同预测值下的可选方案与可能后果。

2.评估可能后果集合的概率。

以上两步,过程理性和贝叶斯定理要求基本一致。都需要基于历史统计得到各可选方案的概率。这种预测被称作“初始观点”。”从理论上讲,我们希望将初始观点建立在过去的经验最好是社会经验的集合之上。”[1]

3.改进预测的数据,获得新数据,从而改进预测模型。

新信息和原有信息结合起来的理性过程也是应用了贝叶斯定理。同样,基于大数据的量化基本面分析法可以更及时的收集最新数据以及结果反馈来改进预测模型。

4.预测模型结果将会影响可选方案集合,以及可能后果集合,从而持续优化决策过程。

持续优化的预测模型,即是一个预期过程,可以进一步减少不确定性以及消剪了行动域即可选方案集合。这点本质上也是缓冲预测误差影响,和量化中动态对冲,不断调整风险敞口的方式是一致的。

5.从可能后果集合中,根据预期目标,选择满意的可能后果集合子集。并从可选方案集合中得到满意的可能后果集合子集对应的方案。

在AlphaGo中使用蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)结合估值网络(Value Network)来做可选方案集合选取。其决策时也可以认为是符合过程理性的。比方AlphaGo会走一步导致赢面更小,但赢的概率更大的棋。这太不优雅了,但修改对局势的期望,减少了搜索时的空间。

而投资人、分析师会基于之前的经验与直觉做这个决策。依托的是人类的长期记忆和人类个体和集体的学习能力。纳特•西尔弗也认为从噪声中区分信号既需要科学知识,也需要直觉,那是基于人类长期记忆的。郝伯特·西蒙对比过国际象棋世界冠军十年间不同的下法,认为这是这是全部职业强选手的集体经验而积累起来的知识的结果。专家和新手区分不仅仅是前者具有大量和多样的信息,而且是他的直觉经验使他能发现他所面对的形势中的熟悉模式,长期记忆中储存大量的棋子的共同模式,通过识别这些模式,从长期记忆中重新找到大量相关信息。

不论如何,这是一个过程决策,正如郝伯特·西蒙强调的“抉择不是由问题的客观特征所唯一确定的,而是取决于用来达到决策的启发式过程。”[2]

 

◆ ◆ ◆

三、结论

基于大数据的量化基本面分析不只是弥补了公司季报时间上空白,也不只是通过方方面面的数据提供更多特征得到更好的基本面分析预测结果。其本身也是一个符合过程理性的分析方式。介于其也是随着大数据的发展刚刚起步的新的分析方法,如何不断借鉴量化、基本面分析法、大数据、机器学习等各方面的成果还有待进一步探讨。就像黄霑歌词里写的“论武功 俗世中不知边和高 或者 绝招同途异路”。

原文发布时间为:2016-11-25

 

时间: 2024-07-31 15:06:56

结合AlphaGo算法和大数据的量化基本面分析法探讨的相关文章

基于大数据的量化基本面分析一定有更好的预测吗?

本文不是讨论如何使用量化基本面分析法预测公司股价.而是以郝伯特·西蒙的过程理性理论结合AlphaGo算法步骤探讨量化基本面分析法的分析方式. 量化基本面分析法(Quantamental)将量化和基本面两种方法结合起来,是近几年随着市场电子化.大数据.自然语言处理技术快速发展产生的新的基本面分析法.现在已经是DT时代,发挥海量数据价值已成为可能.以下讨论都是假设已合法的收集相关数据包括交易.消费.关注度.GPS.卫星数据等等. 一.基于大数据的量化基本面分析法一定有更好的预测吗? 一般来说,我们会

科大讯飞刘庆峰:AI要改变世界,算法、大数据、行业专家缺一不可

10月24日,科大讯飞在其大本营安徽合肥举办了首届全球1024开发者节.会上,科大讯飞董事长刘庆峰发表了<1024 AI因你而来>的主题演讲. 刘庆峰指出,人工智能是这个时代最伟大的技术,其对当前社会的改变,将会超出我们常人的想象.目前来说,人工智能现在有两个主要方向:一个是基于数学统计.建模的人工智能发展模式,以深度学习为代表:一个是对人类大脑科学的研究. 刘庆峰还表示,通过与教育.医疗等领域的机构通力合作,科大讯飞的开放平台与传统领域的应用程度正在逐步加深. "目前,讯飞开放平台

金融大数据公司量化派宣布完成5亿元C轮融资

金融大数据公司量化派(QuantGroup)今日正式宣布完成C轮5亿元融资.本轮由阳光保险领投,复星集团旗下PE基金复星创富以及国信弘盛(国信证券旗下)进行跟投,此外赛点资本也参与了量化派的本次C轮融资. 量化派创始人兼CEO周灏表示,此轮融资主要用在行业扩展.上下游的布局和人工智能团队建设方面. 此前量化派已完成由复星昆仲.高榕资本.华创资本的A轮融资及由知新资本.Star VC.东方富海.将门.必海资本的B轮融资. 量化派创始人&CEO周灏表示,此轮融资主要用在行业扩展.上下游的布局和人工智

【Spark Summit East 2017】将HPC算法引入大数据平台

本讲义出自Nikolay Malitsky在Spark Summit East 2017上的演讲,主要介绍了使用轻量级源工具集开发的,基于MPI的Spark平台的扩展,扩展的背景和原理正如题目所示:将HPC算法引入大数据平台.

谷歌依靠算法和大数据“干掉”语言学家

你能想象一个致力于打破语言障碍的项目小组里竟然没有一位语言学家吗?但是谷歌就是这么做了,这家公司打算依靠算法和大数据最终"干掉"语言学家. 谷歌是一家极度看重算法.充满工程师文化的公司,但或许你还是会为此而感到惊奇--他们认为翻译是一个数学和统计学方面的问题.最近,位于谷歌总部的http://www.aliyun.com/zixun/aggregation/9827.html">谷歌翻译团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家. 谷歌翻译

大数据的新玩法

大数据虽然已经不是什么新鲜事物,但是大数据正在给我们的生活带来更多的惊喜和改变.如果你还认为大数据仅仅只是可以应用在交通.金融这些传统领域,那么就真的是"OUT"了.大数据的能力会让你大开眼界,下面就来看看,大数据的新奇玩法-- 大数据预测死亡 美国波士顿市贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)的研究人员开发出一种超级计算机系统,据称可预测患者死亡时间,准确率高达96%. 美国波士顿市贝斯以色列女执事医疗中心(Beth Is

大数据与量化投资

    互联网和金融,真的是两个最聪明群体所从事的行业.似乎这两个行业,都是开始就高薪,并且未来想象空间无限.所以才会有那么多人才蜂拥而至.随着互联网不断发展,互联网和传统领域的结合成为更重要的方向,这两个最聪明的行业会擦出怎样的火花呢? 一.互联网的核心逻辑 互联网是将计算机连接在一起的信息网络,计算机是通过二进制的核心逻辑进行存储和计算的高级数学机器.整个的互联网其实就是用数字表达很多现实的信息,并进行无国界.无时间限制的信息传播.核心来看,互联网主要发挥着信息存储.信息计算.信息传播的作用

【干货】牛津博士讲大数据和量化金融

演讲全文: 很高兴来到这里,我是第二次参加这种会议了.我这次是以第二个身份来的,就是牛津大学NIE金融大数据实验室,代表实验室过来,今天主要分享一下我们实验室做的关于量化金融的思考跟案例. 首先简单介绍一下我们的大数据NIE实验室,是一个全新的实验室,是2013年11月正式成立的,我们实验室的定位是世界主要大学的第一个以金融大数据为研究方向的实验室. 我们是交叉学科的实验室,目的是把数据科学运用到金融领域,包括很多学科交叉在一起.因为我们的接口是牛津大学金融数学系,这个系框架上有金融.计算机.统

翻译这事儿,Google认为算法和大数据比语言学靠谱

我相信你已经能知道 Google 是一家极度看重算法.充满工程师文化的公司,但或许你还是会为此而感到惊奇--他们认为翻译是一个数学和统计学方面的问题.最近,位于 Google 总部的 Google Translate 团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家. Google Translate 部门主管 Franz Josef Och 同样也是德国计算机科学家出身,他不但并不精通语言学,甚至并不擅长语言学习.他认为,机翻的关键在对数学.统计和编程方面的擅长. Go