雷锋网(公众号:雷锋网)3月13日报道,在日前于武汉举办的申万宏源投资高峰论坛上,通联数据王政就“投资科技与科学投资”做了主题演讲。
王政,美国普林斯顿大学物理学博士,曾任巴克莱全球投资公司基金经理、博时基金股票投资部总经理、ETF及量化投资总监等职,他拥有近20年资产管理、金融信息平台研发和大数据研究经验。
王政表示,投资科技是跨界的工作,需要把投资专业知识和逻辑与技术更好地结合起来,它需要具备几个核心的要素:第一是一定要有专业的投资研究理解,只有这样理解的基础上才能把技术用来解决投资中的问题。第二是需要有人工智能这样的核心工具,帮助解决大数据时代中各种各样的问题。
以下是王政演讲内容,雷锋网做了不改变原意的编辑:
今天我本来想用大的题目金融科技(FinTech),这个东西太火了,但因为金融科技涉及面太广,银行、保险、支付等等,我今天主要是讲投资科技与科学投资的关系。
什么是投资科技(InvesTech)?
为什么叫投资科技(InvesTech)呢,跟IT有点差异性。投资科技的缩写还是IT,看起来没有什么区别,其实投资科技和IT还是有本质区别的,IT帮助我们解决工作上的一些问题,投资科技更多是跨界的工作,需要把投资专业知识和逻辑与技术更好结合起来。这里面有几个核心的要素需要具备:
- 第一是一定要有专业的投资研究理解,只有这样理解的基础上才能把技术用来解决投资中的问题。
- 第二是需要有人工智能这样的核心工具,帮助我们解决大数据时代中各种各样的问题。
科技在投资领域的应用不是什么新鲜的事情,早期我们用科技来提升信息传输的速度,信息对投资来讲是非常重要的。随着计算机的发展,我们开始引入了计算机来传递信息,也用计算机处理信息、分析信息。从70年代开始,投资管理在产品上有很多的创新,开始有指数基金,80年代有对冲基金,现在有智能投资和新的产品,随着科技发展应运而生,科技在帮我们引领产品的创新。
投资科技的核心基础有三个技术非常重要,一是云计算,二是大数据,还有最核心的人工智能。
云计算帮助我们解决计算的能力和存储路径,在此能力基础上我们才能够采集更多的信息,才能把更多的信息存储下来,才有我们现在讲的大数据。
有了大数据之后,我们对用机器处理数据的需求越来越高,而且有这样的样本以后去学习的精确度会越来越提升。
大数据的产生归纳为三个维度:
- 第一个是关于物的信息,我们记录下各种设备的位置。
- 第二个是关于人的信息,每个人都有手机,这个手机有很多信息,我们的位置,我们每天走了多少步,我们在什么地方消费了,所有人的信息都会被收集下来。
- 第三个是环境的信息,低轨卫星的发展可以让我们收集到更多环境的信息,我们也和美国卫星采集公司合作,我们要看新疆光伏场地的信息,不需要亲自去了,用低轨卫星的照片就可以看到,每隔几天扫描一次,可以帮助我们做更高层的研究。
大数据不仅仅是讲数据多少的问题,更多是在数据的维度上扩展。
如果仅仅是行情数据,再高也就是一个类型的数据,如果我们有其他维度的信息,对我们投资的帮助会更大。一般有两类信息,一类是和企业合作的专业数据,互联网公司支付体系、运营商、商贸、物流、电力、大宗商品等企业存下来非常有价值的数据,以前没有被我们所用,现在可以把这些数据用于投资,专业的数据需要通过合作引入到投资领域中,需要做一些脱敏。
公开数据,网上都可以看见,它的挑战是什么呢?需要技术把这些数据清洗干净处理好,为我们提供了多维度的信息,同时及时性也提高了,可以通过高速的处理平台引入到我们的模型中。一个是广度,一个是速度,为我们提供了更多的投资价值。
投资科技最核心的技术是人工智能,不仅仅是技术的升级,更多是改变我们服务的模式。有了人工智能,我们可以做很多场景化的服务,精准营销可以知道某个点需要什么东西,做研究和投资也是一样的,机器可以帮助你识别一些感兴趣的东西。服务的模式也会跟以前不一样,有了人工智能以后,我们做智能投顾,完全是场景化、个性化的服务。
投资科技比较大的应用领域,投资科技比较大的应用领域,是智能投研和智能投顾,帮助大家提升效率,把基本面和量化结合来做研究,用于资产管理行业。
投资科技如何帮我们做科学投资?
很多年前记得有一门课,最核心的一点就是从艺术到科学,所有模型都是用科学的方式来做,所以招了很多学理工科的做研究员。目的就是基于一定的投资逻辑构建出模型,能够实证分析,不仅样本有效,而且样本外也可以有用。用非常严格的流程和方法来做投资,这就是早期量化投资在做科学投资很核心的点。我们做指数投资,其实就是科学投资的方法,只是用了组合投资的概念。现在发展到新的阶段,有点像组合的组合了。
随着技术的发展,量化投资的引入进入了工业时代的阶段,我们会找一个团队,有研究员,有做数据的,有做基金管理的,一个团体在科学的流程下完成投资管理任务。这个阶段有点像工业时代的流水线,整个效率大幅度提升,重复性比主动投资强很多。
现在随着数据的增加,数据化程度提升,我们已经进入了信息时代。信息时代数据这么多,存储到各种各样的资源上,如果想继续用量化的方式一个个来构建,这个工作是非常大的,在座各位积累到那个程度需要很多的精力和时间。逐渐的,我们开始要借助技术,教机器去归纳和总结,机器没有人这样的创造性思维,但可以做很多以前人所思考的东西,智能投资机器的概念越来越流行。
概括来讲,第一个阶段不需要任何设备辅助可以做投资,第二个阶段可以教机器技能,就按照你交代它的事情去做。到现在,更多是想办法教机器去学习,逐渐帮助我们提取我们所需要的知识和关系。
信息处理上,每一个研究员会面临着读很多的公告,公告作为信息的主要来源,每个研究员,无论是基本面还是量化的都会关注。每个公告来了都是一百页甚至更长,怎么样把公告的信息快速读取,这是很有考验的,但是机器可以帮助我们做文本处理,提取非常有价值的信息。
第二,所有信息来了以后有很多关联关系,人去建立这样的关系是可以的,但是精力不够,机器就可以很快建立这样的关联关系,以及用模型帮你建立起关联关系的强度。
第三是主题发现,我们经常做主题,怎么样从大量信息挖掘出新的亮点和主题,我们无法从这么多东西总结出特定的主题来,这些主题又和哪些公司有关系,这是我们很关注的,怎么样匹配出这些公司来,这是文本方面。
第四,情绪分析,一篇文本信息的情绪怎么样测算,一段语言的情绪怎么样测算,都是可以通过计算机来测算。
传统金融机构如何向科学投资转型
在这里对科学投资的一点点个人理解和大家分享。
- 第一个是在理念上要有所改变。
我们要从传统的量化投资向智能投资方向改变,不能简单靠传统研究各种各样的模型,这个模型可能有价值,但随着数据的增加,这样的工作会非常漫长。
以前的量化投资找市场共性工作流程,发展到研究某个行业、研究个股的模型,从共性到个性进行有规律的总结,每个股票也有规律。以前的模型数据比较好,IC比较高,但随着数据越来越多,数据信息准确度越来越低。要从高IC到低IC,要接受IC比较低的信号,我们要通过很多的信号来选取IC。
此外是从单点到全局的转变。原来我们看的都是定义指标,抽取每个股票单点信息,尽管组合起来,但还是不够全面,我们要从公司全貌来看。有些信息可能还需要我们做非结构化到结构化的过程,我们希望把公司更全面的去看特征。
最后是从固定模板到动态学习,原来一个模型可能是做好一直在运行,需要花很长时间修改模板,未来学习机器帮助我们动态学习和提升。
- 第二,数据的维度上要改变思考。
首先,以前的数据都是特定的数据专而精,现在要朝着全样本的角度发展,这样会更加科学更加合理。
其次,以前的数据都是定时发生,现在要从定时发生的数据到实时发生,在我们的模型中去反映出来、体现出来,要求有动态反映实时信息的能力。
再次,我们要接受低密度信息的趋势,以后很多很多的信息密度会越来越低,以前是高含金量的矿石,现在是低含金量的矿石,怎么样从里面筛取真正有价值的信息,这需要投资科技帮助我们解决。
- 第三,要关注对平台的重视。
现在所有做量化的,还是倾向于自己建量化研究系统,但随着数据的增加,计算能力需求加大,所有的都是自己建,这种可能性越来越低。未来一定要共享外部资源,帮助你做很多事情,包括计算资源、存储资源、数据资源,甚至你的信号都可以应用外面的信号,帮助你提升研究能力。
第二个是我们要接受公有云的服务,以前什么东西都是自己建设,用100个机器帮你建模型不太现实,公有云发展越来越成熟,也越来越安全。
第三个是从全方位到专业化,我们现在做投资什么都要自己弄,其实把很多精力花在不应该的地方,每个人应该专注于核心能力,业务上哪块最强就应该集中精力。互联网时代最大的变化就是能够快速共享很多资源,所以要从全方位什么都干到专注到某点共享外部资源。
最后是从产品发行的模式向场景化服务的模式转换。传统基金管理投资还是发个产品去卖去销售,未来投资者更关注这个时候需要什么,你就给我提供什么服务。就像现在卖保险,不是像以前给你一个单子去填,你在哪里买了机票,就来个延误险,这个场景就要提供服务,而且是特定的服务。半个小时要登机了,敢不敢卖这个保险。阿里巴巴的小额贷款,能够实时给你贷款,就是因为有信用评估的能力,可以根据你的需要动态给你贷款。我们做投资,未来也是逐渐朝着这个方向发展。
这就是科学投资的理解,一个是理念,一个是数据,一个是平台。
总结
最后的小结,投资科技给我们带来的帮助无外乎三个方面,
- 一是帮助我们做信息处理。
- 第二个帮助我们构建机器学习。
- 第三个可以共享知识和研究。
从科学投资来讲未来有三个阶段,大家可能可以预见:
- 第一个是提升工作效率,怎么样做到专业搜索,让你快速获取想要的信息。现在的信息不是不够,而是太多,这么多的信息里面怎么样获取精准需要的信息,这就需要我们有专业垂直领域的搜索帮助我们解决问题。我们需要借助机器帮我们处理信息。
- 第二个是帮助我们构建知识图谱和模型,真的让数据驱动我们投资,这是具有挑战的。一旦用数据驱动投资,构建这样机器的时候,那就是智能投资的阶段了。
- 最后我们有个愿景,机器人基金经理,由机器人帮助我们完成投资全流程。
据雷锋网此前报道,通联数据(DataYes)是万向集团投资成立的一家金融资讯和投资管理服务公司,该公司希望通过大数据、云计算、机器学习等信息技术,为资产管理人提供新的金融资讯和投资研究数据分析服务。该公司旗下的萝卜投研,作为基本面研究平台,主要研究怎么样把基本面和量化分析框架结合起来。此外,也有在线量化研究平台,两年前也研究了智能投顾,主要在于分析用户行为,匹配更加个性化的服务,而不是在市场上做短配置。
本文作者:温晓桦
本文转自雷锋网禁止二次转载,原文链接