科学评估

量化研究里怎样做样本内外划分,才更接近真实世界

讲解量化研究中的样本内外划分方法,包括时序切分、滚动验证、市场阶段分层与避免未来信息泄露的关键原则。

2026-03-288分钟
很多研究会简单地把数据切成训练集和测试集,看起来像做了样本外验证,但如果切分方式忽略了时间顺序、市场阶段和特征构造中的信息泄露,这种验证并不可靠。
量化研究的难点就在于,你面对的是时间演化系统,而不是静态样本集合。

时序切分、滚动验证和阶段验证应当一起考虑

比较稳妥的做法通常是,先保证严格的时间顺序,再用滚动窗口观察稳定性,同时额外检查策略在不同市场阶段中的表现。这样你能更接近真实世界里的“策略会不会在未来继续活着”这个问题。
如果只做单次切分,很多阶段性有效的策略会被误判成长期有效。

验证的目标,不是证明策略有效,而是尽量揭露它何时失效

很多人做验证时,潜意识里是在想办法证明自己的策略是对的。但更成熟的研究者会反过来,主动寻找它在哪些条件下最容易出问题。
只有把失效边界看清楚,策略才更有机会在真实环境中稳定使用。

关键结论

  • 样本内外划分的重点是贴近真实时间结构,而不是形式上切一刀
  • 滚动验证和市场阶段验证比单次切分更有意义
  • 验证的价值在于找失效边界,而不是自证正确

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105