好问题,结合最近读到的一篇Microprice Research,来梳理一下,抛砖引玉。注:实际生产中的microprice非常复杂,都会掺proprietary alpha,就是每个shop的ip了。
Prerequisite
在Orderbook的语境下,什么才是fair price呢?
Mid-price?
Pa是best ask, Pb是best bid。看起来通俗易懂,但是有以下3点缺点:
- Mid 高度自相关(auto-correlated),这个现象也叫bid-ask-bounce
- Mid相比于quote来说,变化的频率低,因此是一个低频信号
- Mid没有考虑volume
Weighted Mid?
好,我们来加入Volume
这里的I也叫imbalance,这里的Qb是total volume at best bid, Qa是total volume at best ask, 分别也叫bid size和ask size。至此,我们已经有了现代Microprice研究的起点。Weighted Mid并不是完美的,它也有2点缺点:
- 因为每次imbalance的变化都会导致weighted mid的变化,因此它作为high frequency volatility estimation的时候非常noisy
- 因为weighted mid不是一个martingale,所以有一些反直觉的现象。比如Pb = 10, Qb = 9, Pa = 10.02, Qa = 27, 此时weighted mid是 9/(9+27) * 10.02 + (1-9/(9+27)) 10 = 10.005,此时如果来了一个sell order [email protected],此时新的weighted mid 是 1/(1+9) 10.01 + (1- 1/(1+9)) * 10 = 10.009, 新来了卖单,应该让fair price降低,此时却上升了。
Microprice
定义
掌声有请本文的主角,microprice,本文的microprice特指Stoikov, 2018提出的microprice,主要用的L1 orderbook,实际生活里有更多depth的。
M是mid, I是老朋友imbalance,S是bid-ask spread。如何来estimate g呢?Stoikov认为,microprice是the limit of a sequence of expected mid-prices. 数学语言是:
为什么要take the limit of expected mid as time goes to infinity呢?作者认为1) microprice是horizon independent的,这样trade at different frequencies的asset可以互相比较 2) mid里的microstructure noise被filter out了。
接着作者提出两个假设:
- Orderbook中的信息由3-d Markov process Ft = sigma_field(M_t, I_t, St)产生的filtration决定。其中M_t是mid,S_t是bid-ask spread,I_t是top of book imbalance。这里作者指出可以加入Level2的信息。
- Expected mid price increments 独立于mid price level,即:
这样每个tick的price dynamics都相同。
由这两个假设,作者得出:
Finite state space example
为了能计算microprice, (Mt, I_t, St) 必须有explicit的dynamics。值得指出,如果I_t独立于M_t, microprice = midprice,而如果I_t是Brownian motion and behaves a particular way at the boundary, microprice = weighted mid.
让我们用discrete time step,那么It就从1<=i<=n中取离散值,S_t从1<=s<=m中取离散值。Imbalance的离散化就是:
Spread St可以用number of ticks表示。Midprice change Mt+1 – M_t从 K = [-0.01, -0.005, 0.005, 0.01]。这里用的half tick因为如果bid或者ask move by 1 cent, mid moves by 0.5 cent. 用x = (i,s) 来代表state space of Xt = (I_t, S_t).
作者指出,以上计算microprice的方法是不guarantee convergence的。如果Q,R,T不被estimated carefully, 可能会incorporate drift in data,导致Pi blow up。因此引入以下条件来确保convergence。
实证研究
数据
作者选用了Bank of America(BAC)和Chevron (CVX)两只股票的bid ask quote,注意到BAC和CVX有非常不同的微观结构,体现在不同的tick size分布上,BAC的mid也change much less frequency than CVX。这个区别,来源于BAC的price比CVX更低,tick size of 1 cent占price的百分比更高,因次BAC也叫large tick stock。
实验set up
可以看到microprice adjustment在midprice和weighted mid之间:
注意到当spread widen, slope of microprice as a function of imbalance lessen,也就是说imbalance are less informative. 另外,对于BAC这种large tick stock来说,microprice adjustment更大。
因为microprice是horizon-independent的,因此用来评估预测future price的有效性,需要选一个timescale。如果time scale太小,那么empirical price change will suffer from microstructure noise, i.e. autocorrelation effects. 如果time scale太大,那么empirical price change就会有很多noise,95% 置信区间也会很大。
两个实验。
结论:
代码实现
(文末有原作者Github repo)
生成Orderbook statistics:
Symmetrize data (to ensure convergence)
Estimate:
References:
来源:知乎 www.zhihu.com
作者:水心记
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 1 个回答,查看全部。
延伸阅读:
高频交易为什么能持久存在?