晓风深圳英迈思文化科技有限公司
阅读新闻

什么是高频数据?

2014年5月15日

高频数据是指数据采样的时间问隔较短,采样频率大于一般研究时所采用的频率。但高频这个概念是相对而言的,例如,对于股票,可能要在一天内有多个数据才能称为高频数据,而对于宏观经济数据,可能一周采样一次就可以称为高频数据了。

  数据特点

  相对于低频数据而言,高频数据并不等同于低频数据的时间细分,由于受市场信息不确定性和连续性的影响,高频数据主要呈现下列特点:

  1.不规则交易间隔

  与传统的低频观测数据(如年数据、月数据、周数据)相比,金融高频数据呈现出一些独有的特征。最为明显的特征便是数据记录间隔的不相等,市场交易的发生并不以相等时间间隔发生,因此所观测到的金融高频数据也是不等间隔的。从而交易间的时间持续期变得非常重要,并且可能包含了关于市场微观结构(如交易强度)的有用信息。

  2.离散取值

  金融数据的一个非常重要的特征是价格变化是离散的,而金融高频的价格取值变化受交易规则的影响,离散取值更加集中于离散构件附近。价格的变化在不同的证券交易所设置不同的离散构件,称之为变化档位,我国证券交易所规定股价变化的最小档位为0.01元;在纽约证券交易所(NYSE)中,最小档位在1997年6月24日以前是1/8美元,2001年1月29日以前是1/16美元。

  3.日内模式

  金融高频数据还存在明显的日内模式,如波动率的日内“u”型走势。每天早上开盘和下午收盘时交易最为活跃,而中午休息时间交易较平淡,随之而来的交易间的时间间隔也呈现出日内循环模式的特征。Mclnish和Wood(1992)对价格波动率的日内模式进行了探索,发现波动率在早上开盘和下午收盘时往往较大,交易量以及买卖价差也呈现出同样的变化模式。Engle和Russell(1998)对交易持续时间(duration)的日内模式进行了研究,也得出了类似的结论,从图形上来看变化模式类似于倒“U”型。

  4.自相关性

  高频数据与低频数据一个非常大的区别在于高频时间序列具有非常强的自相关性。高频数据的离散取值以及买卖价差等因素是导致强自相关性的原因,还有一些因素,如一些大额交易者往往将头寸分散交易以实现最优的交易价格,这可能导致价格同方向变动从而引起序列的强自相关性。此外,还有许多其他因素导致高频数据的强自相关性。

  金融高频数据的特征远不止这些,数据还包含众多的信息维度,如交易的时间间隔、交易量、买卖价差等。这些不同的信息维度对于理解市场微观结构具有相当重要的作用,正是由于金融高频数据的独特特征,传统的计量分析模型在实际应用中遇到了许多问题。