量化技巧

约束式 LLM 因子代理开始有研究价值的前提,是假设、配方和回测门槛都被写成硬规则

解读 From Hypotheses to Factors: Constrained LLM Agents in Cryptocurrency Markets,讨论约束式 LLM 因子代理为什么比自由生成更接近真实量化研究。

2026-05-048分钟
很多所谓 LLM 挖因子系统的问题,不在于模型不会生成,而在于它生成得太轻松,研究员很难判断一个想法是经验上成立,还是只是文本共现带来的幻觉。本文最有价值的设计,是把 LLM 的角色限制成“提出假设和配方”,而不是直接充当 alpha 裁判。
作者要求代理的每一步都映射到可执行因子定义、固定数据切分和预先写好的经验门槛上。这样一来,模型的自由度被明显压缩,但研究过程反而更像真实量化团队里的因子评审。

强点在于把假设搜索和经验验证分开了

这篇文章没有让代理直接对收益负责,而是让它在假设层和配方层提供候选,然后把是否通过交给确定性的评价引擎。这种分工比“让代理一边想一边判”更可控,因为它保留了实验规则的外部性。
对量化团队来说,这意味着 LLM 可以负责拓展候选空间,但不能跳过验证制度。真正节省时间的地方,是把研究员脑子里的模糊叙述更快翻译成能回测的配方。

边界同样很清楚:它更像加密横截面研究助手,而不是通用自动 alpha 机

论文的样本和因子词汇仍深度依赖加密市场的横截面设定,因此目前更适合作为一个受约束的研究接口,而不是可以无缝迁移到股票、期货和期权市场的通用因子工厂。
另外,代理提出的经济叙事如果长期被限制在有限模板里,也可能逐渐收敛成一套新的研究偏见。硬约束解决了胡说八道问题,但不自动解决视角单一问题。

实务上最值得学的是“先写规矩,再让代理干活”

很多团队一上来想优化的是提示词,但这篇论文给出的顺序更对:先规定哪些假设算可测试、哪些指标算通过、日志怎么保存,再让代理进入流程。规则先行,模型后置,才能把代理从 demo 拉到研究基础设施。
如果要在传统市场复用,第一步不是复制它的自然语言界面,而是把你自己的样本切分、交易成本、覆盖率和因子多样性门槛全部写成程序。

关键结论

  • LLM 因子代理真正有用的时候,是它只能提出可证伪假设并接受固定实验门槛时。
  • 把自然语言假设、可执行配方和回测反馈接成闭环,比“让模型自由找 alpha”更稳。
  • 落地时最关键的不是再加一层 prompt,而是保留审计日志和硬约束。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105