Level-2 数据真正珍贵的地方,不是“比 Level-1 更密”,而是它把交易订单的结构显性化了。逐笔订单里除了价格和数量,还能看到订单编号、时间戳、拆分成交关系以及买卖两侧更细的属性。这样一来,研究对象就不再只是 bar 数据,而是一个个可被重新组织的订单事件。
材料里对“大小单”和“长短单”的定义非常适合做成工程模板。一个直观写法是
Big(size;k)=1[size>μsize+kσsize],Long(duration;k)=1[duration>μdur+kσdur] 。也就是说,先用均值加若干倍标准差去定义什么叫大、什么叫长,再在这个基础上做后续交叉。源材料采用了
k=1.0,1.5,2.0 三档阈值,本质上就是在控制因子对稀有大单和极端长单的敏感度。