Liang FANG’s Blog My Thoughts On Everything

译文 | 金融数据的代际变化

原文:The Changing Generations of Financial Data1

作者:Tammer Kamel, CEO and Founder of Quandl

译者:方亮,已获作者翻译授权


作为金融分析师,我们都能意识到,每一个模型都有适用期。迟早有一天,每一个「专有」分析技术背后所蕴含的思想和技巧都会被扩散到更广的范围,到那个时候,技术将不再是竞争优势或超额收益的来源。

但我们没有意识到的是,类似的模式也适用于数据的世界。稀有、独特和专有数据最终都会扩散,变得普遍、易得、没有边界。

最好的分析师会不断优化他们的模型,以防止其不可避免的过时。同样,最好的分析师也会不断扩充他们的数据获取量以成为超额收益新的来源。

「能获得竞争优势」的数据

信息就是力量。市场上一直不乏这样的案例:一位拥有独特且重要数据的交易员,与一位没有这些数据的人相比肯定有优势。「信息优势」是一种最彻底、最简洁、最明显的赚钱方式,而且一直以来都是。

二百年前,地缘政治事件进入“能获得竞争优势”的数据的类别。在前电报和新闻服务时代,能在其他人之前知道战斗、选举和活动结果是一个巨大的优势。当然,如今已经没有不被顷刻之间传遍全世界的新闻了。

一百年前,股票价格进入这一类别。这是行情报价器和投机商号的时代;Jesse Livermore 和 J. P. Morgan。许多经典的价格相关交易策略,包括所有受现代股票行情分析师所喜爱的技术模式,都是在这一时期被开发出来的。当然,如今每一个分析师都可以免费或廉价地获取高质量的股票价格数据。

五十年前,公司财务数据进入这一类别。在路透公司首先于 1970 年代数字化了其公司公告之前,这些数据都是很难找到也很难使用的;但不管怎样,最好的分析师还是会使用它们。Benjamin Graham 和 Warren Buffett 在这一时期开始崛起并非巧合;这是基于基本面投资的时代。当然,如今每一个分析师都可以免费或廉价地获取高质量的股票基本面数据。

五年前,情绪数据进入这一类别。多亏了互联网,投资者们有史以来第一次可以接近真正的群众智慧,亲自测量弥漫在市场上的恐惧、贪婪、希望和绝望的程度。在 2010 年代初,只有最大的银行和对冲基金有实力使用 Twitter firehose 数据流和类似的数据源。当然,如今每一个分析师都可以免费或廉价地获取高质量的情绪数据。

事实上,数据的景观一直在变化,分析师必须不断进步才能跟上它。五年前那些独特、罕见的数据现在变得很普通。如果有什么区别的话,那就是这种变化的步伐在加速。

见证一次数据革命

我们正处于一次数据革命之中。

所有的业务流程都在数字化。像 Walmart 和 Target 这样的公司可以精确地知道你在找什么,你最终会买什么。其他公司如 ADP、MasterCard 和 FedEx 等则深入参与到了薪酬、交易、交付,以及商业流程上的各环节。这些公司的每一个活动都为分析而记录和存储了下来。

人与人之间的交互也正数字化。社交网络、即时通讯和网络搜索描绘了关于人们的兴趣和交谈对象的一幅生动、实时的图景。同样,每一个活动都为后世而记录和存储了下来。

智能手机无处不在。这意味着在每个口袋里都有一个精确的位置传感器、录音机、摄影/摄像机、无线电应答机和互联网连接。几乎已经没有处于手机网络覆盖范围之外的世界了。

汽车和卡车现在都已嵌入传感器,跟踪位置、速度、交通情况等。卫星和 GPS 已经从少数人的特权(军事)变成了大众的玩物;图像和位置数据是当今的公共利益。

由于这些技术创新,我们被淹没在了一片数据的汪洋之中。然而,如果没有另一个计算领域的平行并进,这些数据将毫无意义。由于摩尔定律的不断推进,我们有足够的带宽采集这些数据,有足够的内存来存储,周期性地进行分析,并从中提取商业价值。

这种能力改变了各行各业。今天,每一个公司都是数据公司。这些公司产生了大量的数据,在追求利润的过程中也消耗了大量的数据。不管怎样,公司和分析师们现在能——实时!——查看相同的数据,这些数据总有一天会出现在 10K 文件(年报)、经济公告或财经新闻中。

作为金融分析师,这既是一个机会,也是一个威胁。机会在于从所有这些新的数据源中可以发现新的超额收益。这里的潜力是巨大的:每一个行业都将被数据改变,能早点接触那些数据,意味着能从一个内部视角看待这些行业和公司。

威胁在于,其他人可能会冲击你。如果你不使用这些新的数据源,你的交易对手将会是那些使用数据,并比你拥有更多信息的人。那是一个必败的游戏。

每一个公司都是数据公司

波罗的海干散货指数、ADP 薪酬调查、ISM 制造业指数和 NAHB 住房调查,所有这些例子本质上都不是「传统上」的金融数据集(因为它们相应来自航运保险公司、薪酬提供方、供应链集团和制造业协会);然而它们改变了市场。近年来,越来越多这样的由经济体各领域的公司所创造的数据集开始浮现。

INRIX 为广大的汽车制造商和货运公司提供位置跟踪服务。他们采集的这些数据使得他们可以详细描绘美国商业路网的交通图景;这是对于经济预测很有价值的信息。在铁路领域,Transmatch 做着类似的事情。

MasterCard,借助其支付业务,拥有全面的用户消费模式信息,并可分解到零售商、产品、区域、人口统计学等维度。Second Mesure 则利用公有和私有工具的组合生成了类似的数据。

Premise,汇聚了一大批智能手机用户来实时采集通胀信号;一种对华尔街极具价值的数据集。Borrell 跟踪广告支出数据,而 Backtest 则采集客户获取成本。

ArgusSpireSpaceKnow 都是利用直线下降的卫星图像成本,分别围绕作物产量、航运和制造业创造了新颖的预测数据集。

DataMinr 是非传统数据领域的先驱之一。通过解析实时的 Twitter firehose 数据流,他们生成了最早的「公众情绪」数据集,并卖给了投资银行和对冲基金。

Accern 旨在采集依据类似的情绪数据,但基于更广泛样本空间的采样,包括数以百万计的网站、博客和媒体页面。

这些数据提供方有的已经在 Quandl 平台上,还有更多在推进中,这个群体只会越来越大。

冰山一角

我们仅仅触及了潜在非传统的数据源的表面。与未来十年我们将能获得的数据源相比,我们现在能获取的数据真是相形见绌。

与我们当前的智能手机网络相比,物联网(IoT)所包含的传感器数量将增加若干数量级,分布范围也将扩展若干数量级。无人机和微型卫星将提供实时的物流数据,远比我们当前的覆盖更为精细。产品中的 Beacons 技术和嵌入式芯片将使得获取交易、使用、报废等瞬时知识成为可能。

所有的公司都将会学着来利用所有这些数据。现在,相对于每一个类似 Amazon 或 Target 那样,运行着严格的程序来进行数据收集、分析和行动的公司,仍有更多公司在用老式的规则运转。随着时间的推移,这些公司要么去适应,要么会消失。不管怎样,未来属于那些拥抱数据革命的公司。这意味着可供分析师使用的商业数据只会越来越多。

但随着新数据可用的同时,「旧」数据将变得普通。这是不可避免的,分析师必须为此做好准备。

扩散的频谱

数据有其自然的生命周期。新发现的数据集是稀有的、谨慎保护的、有价值的,因为它们蕴含新的超额收益。随着时间的推移,这些数据将扩散到更广泛的受众,其超额收益的内容减少;尽管如此,分析师还是会继续使用这些数据,因为不这样做将会使他们处于信息劣势。最后,这些数据变得又旧又过时:充分体现为市场在向新的竞争优势源前进。

聪明的分析师会意识到这个过程是动态的,并随时准备去适应。他们已将这个扩散过程内化。

The Spectrum of Diffusion

在评估是否要对稀缺的数据投资时,有些问题需要考虑:我的交易对手是否拥有这些信息?我愿意承担他们拥有这些数据的风险吗?你不希望你的交易对手拥有比你更好的信息。2015 年,投资者们被 JCPenney 的 2 季度报告所震惊。不过,那些购买了 RS Metrics 服务的对冲基金则不会。RS Metrics 使用卫星图像测量各商店的客流量。它近乎实时地公布了 4 月和 5 月客流量的上升。RS Metrics 公司的客户基于此信息进行了交易。8 月中旬,JCPenney 的股价跳涨逾 10%。

这是一个威胁,还是一个机会,取决于你如何看待它。最终,每个人都将能获取卫星数据,就像今天每个人都能获取基本面数据一样,它将不再是那种能获取竞争优势的数据了。

但就现在来说,非传统数据源像卫星数据、情绪数据、客户数据正进入市场。那些能最快接触到这些信息的人,将会保持对市场的领先。


  1. 原文有更新,与最初翻译版本案例部分略有不同。