很多团队已经开始做因子血缘图、依赖图和最小重算,这当然是重要升级。但当因子数量再往上走,就会出现另一个问题:你知道 A 因子依赖哪些字段、哪个窗口、哪个版本,却不知道它在概念上属于“成交行为因子”“库存约束因子”还是“波动状态因子”。没有这个语义层,研究复用会越来越依赖个人记忆。大家知道公式,却不知道这个公式在整个工厂里扮演什么角色。
更深的一层问题,是缺少本体会削弱 AI 的使用效果。大模型或自动化工具在检索因子、推荐模板和生成变体时,最需要的不是大量松散代码,而是清楚的概念边界。只有当系统知道“这是订单流类特征”“这是波动结构类特征”“这是慢变量约束类特征”,模型才可能做更高质量的因子组合和研究建议。否则,AI 只能在无标签仓库里做表面匹配。