量化入门

金融时间序列为什么不是一份普通数据集

结合第一场公开课,解释金融时间序列的非平稳、噪声高、相关性随时间变化等特点,以及这些特点为什么会直接影响量化研究方法。

2026-03-307分钟
普通机器学习任务里,人们习惯默认样本分布相对稳定,训练集和未来数据之间虽然有噪声,但大体来自同一种世界。金融时间序列完全不同。市场结构会切换,流动性会变化,参与者会学习,波动率会放大或收缩,很多昨天成立的统计关系今天就可能开始失灵。这种“会变”的本质,决定了量化研究不能简单照搬普通监督学习套路。
第一场公开课之所以把金融时间序列特性单独拿出来讲,就是因为很多后面的研究错误,根源都埋在这里。如果你不先承认金融数据是非平稳、高噪声、带时间依赖且容易出现 regime 切换的,那么后面的数据切分、回测评价、特征设计和模型验证都很容易失真。
普通数据集 vs 金融时间序列 量化研究方法之所以特殊,是因为数据本身就和普通 ML 任务不是同一类对象。 普通数据集 金融时间序列 分布假设 相对稳定 经常漂移 样本关系 可近似独立 强时间依赖 主要风险 欠拟合/噪声 未来失真/结构切换
这类文章适合用对比图,能让读者马上看见为什么量化研究必须有自己的一套方法论。

一旦承认时间序列特殊性,研究顺序就会被改写

承认金融时间序列的特殊性之后,你会自然接受一些看似“麻烦”的研究纪律:不能随意随机切分数据,不能只看静态精度,不能忽略时间顺序,不能把极端行情当成异常点简单扔掉,也不能假设过去最优参数会在未来继续有效。这些纪律不是形式主义,而是被数据本身逼出来的。
也正因为如此,时间序列认知是很多正式课程的前置基础。如果这一层没稳住,后面哪怕学到更复杂的因子、模型或 AI 工具,也很容易因为底层假设错误而走偏。

关键结论

  • 金融时间序列最大特点是分布和结构都会变化
  • 很多量化研究纪律,本质上都是在响应时间序列特殊性
  • 先理解数据本性,再谈模型,会让后续学习更稳

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105