使用非结构化数据创造另类信息优势是获取非相关超额收益的一个潜在新来源。
半强势有效市场假说认为,资产价格反映了所有已公开信息(法玛,1970)。因此,要想获得超额收益,就必须获得公众难以获取的信息。最近,有越来越多的证据显示这样的信息正通过社会联系、教育网络(Cohen, Frazzini andMalloy, 2008, 2010)、地理邻近(Coval and Moskowitz, 2001)、专家网络,以及能与公司涉及财务管理流程的内部人士直接接触的代理人等进行传递。
近年来,美国一直在联邦和州两级加强对内幕交易的执法力度。著名的例子包括,亿万富翁Raj Rajaratnam所领导的对冲基金Galleon,依靠Rajat Gupta(前高盛董事会成员和麦肯锡董事总经理),通过专家网络非法提供的内幕消息进行交易。
由于对信息流的严格审查,对冲基金选择包括系统交易策略在内的办法,以保持领先优势。对这样的策略,交易一般由量化分析过程确定,并自动执行。从信息流的角度看,这些过程相对没有太多争议,因为一旦算法被编码并开始交易,个人在投资决策过程中不再发挥显著作用。因此,采用此类交易策略的基金能免于内幕交易审查。
基金试图保持优势的另一种手段是挖掘交易中的技术进步。例如,高频交易可以在不到一秒内处理并执行新信息。但是,对于高频交易,有两个突出的问题。首先,由于可能出现的市场操纵,它受到监管层和其他市场参与者指责。因此,高频交易隐约承担着某种形式的监管、法律和头条风险。其次,随着过去十年交易量的显著增加,大量高频交易发生在高频交易系统之间,使得市场环境更具竞争性,因而,利润也变得更薄。这种策略的容量和可扩展性仍不清楚且很有可能受限(Baron, Brogaard andKirilenko, 2012)。
一些数据提供商已经为高频交易公司提供优先获取市场动态信息的服务,这无疑增加了对高频交易的争议。今年夏天早些时候,纽约州总检察长Eric Schneiderman下令汤姆森路透社(Thomson Reuters)停止销售提前获取密歇根大学消费者调查(University of Michigan’sConsumer Survey)结果的行为。在这之前,一些基金可以比官方正式发布给公众提前两秒获得这个结果,这样就获得了相对其他订阅者的优势。
尽管围绕高频交易的争议较多,横跨多种频率的系统交易策略似乎是在当前监管环境下,基金经理们寻找替代优势的最合乎逻辑的投资方式。
金融危机期间,系统化策略的强劲表现,对这种投资方式的普及做出了贡献。CTA/管理期货基金(常被称为趋势跟踪者),通常依靠计算机模型和自动交易执行全球期货和场外交易合约,与对冲基金,如Man AHL,Winton Capital,Canlab和BlueCrest Capital等,自2008年以来,管理资产显著增加。最近的报告表明,该行业板块最高管理规模为330亿美元,最大的基金Winton Capital在这个数据中占比10%。
下图显示了报告到Lipper/TASS数据库以美元计价的系统多元化类别随时间推移的累积管理规模。该图说明了过去直至2011年,管理规模的巨大增长。
随着对大量资本的吸引力增加,可以预期到,回报将减少(Fung, Hsieh, Naik, and Ramadorai, 2008)。两大系统化策略基金(Winton和AHL)的创始人,David Harding说,“我的观点一直是,随着越来越多的资金的进入,原始的趋势跟踪策略将随着时间的推移而变得不那么有效。”
事实上,尽管早期的出色表现,自1990-2008期间,19年内仅一年出现亏损,这些策略自那以后一直表现不佳,自2009年最近五年以来,仅一年获得正回报。
除了产生超额回报的能力下降之外,另一个风险是相关性风险。一旦许多基金利用类似的信息并采用类似的策略,他们收益的相关性会变大,从分散化的角度,对他们的配置将失去吸引力。此类风险的一个例子就是2007年8月的量化危机(Khandani and Lo, 2007),它可以部分解释整个市场的流动性事件(Sadka, 2010, 2012)。
针对该事件的一种解释是,随着时间的推移,许多量化基金都采用了类似的交易策略,如动量和价值投资。一旦一个大型基金遭遇异常冲击,被迫强平所有头寸,所有基金都将遭遇损失,这将进一步导致资产价格低迷。
为了降低这种相关性风险,基金开始着手在别处寻找超额收益(Alpha),例如,通过接入新的数据集。一个典型的例子就是接入媒体数据,例如接入汤姆森路透社(Thomson Reuters)的动态消息。由于这些数据处理比较轻松,在高频公司颇为流行。但是,一旦传开,回报将大幅下降。另一家媒体提供了实例证明,几个月前,因黑客盗取美联社(The Associated Press)的Twitter帐号,发布白宫爆炸的虚假消息,导致道指3分钟之内大跌超过150点之后再涨120点。
使用这种新数据的根本问题在于数据提供者的意愿是让它们通用,但一旦如此,盈利能力必将下降,而相关性风险增加。因此,鉴于常用数据集的局限性,为了获得非相关回报,需要探索未知的领域,并使用数据产生非集中型交易。
未知的领域
投资组合经理和金融分析师们最近开始利用非结构化数据的力量。他们声称,对冲基金分析师已经知道聘请顾问来计数零售商停车场的汽车数量,以预测销售旺季的收入。据报道,瑞银(UBS)分析师购买了沃尔玛停车场的卫星图像,在季度盈利发布之前提前估计其业务活动。
随着可得大数据的增加,捕捉任何从消费者/投资者行为到网上提供的产品和服务的价格动态,为创新型基金经理通过系统化获取和分析非结构化数据从而获得非相关回报提供了巨大的机会。
关于系统性收集新颖数据集及其金融应用的例子在以前的两篇文章中有给出(Ozik and Sadka, 2010, 2013)。这些研究的动机是,通过观察,明星基金经理往往表现不佳。为了正式验证这个现象,我们开始着手搜集媒体关于数以百计的对冲基金的报告。然而,这些信息并不是现成的。通过程序员的帮助,利用一些先进的网络搜索技术,我们获得大约1000个股票型对冲基金在1999-2008年期间的媒体报道信息。事实上,正如预计的那样,正式的统计检测提供了证据,证实广受媒体报道的基金绩效表现并不是很好。例如,下图显示,不考虑市场背景,媒体广泛报道的基金在报道后的两年内平均绩效比未被报道的基金落后4%。报道一年后的月度回报差具有统计显著性。
总之,尽管基金经理所面临的监管、相关性以及业绩挑战,新数据的可用性为愿意探索新领域的创新型管理者提供了独特的机会。独特的大数据集与技术驱动的投资过程的结合,是一个潜在的获得非相关超额收益的新来源。
原文发布时间为:2013-11-27