机器学习量化

LLM 进入量化流程后,最缺的不是想象力,而是编译层和聚合层

结合《Learning to Aggregate Zero-Shot LLM Agents for Corporate Disclosure Classification》与《From Natural Language to Executable Option Strategies via Large Language Models》,分析 LLM 在量化任务里为什么必须引入聚合层、语义中间层和确定性执行器,才能避免把金融流程做成不可审计的黑箱。

2026-04-0510分钟
企业披露分类论文处理的是一个相对朴素、却很有实务意义的问题:如果多个 zero-shot LLM agent 对同一份 corporate disclosure 的判断经常不一致,团队到底该相信谁。作者没有迷信某个单模型,而是让三个 agent 各自输出标签、置信度和理由,再用一个轻量 meta-classifier 学习如何聚合这些差异,最后预测次日股价方向。这里最重要的思想不在于又多了多少点准确率,而在于它把多模型分歧从噪声变成了可学习信号。
期权策略论文更进一步,直接面对“自然语言到可执行交易结构”这个高风险环节。作者没有让 LLM 直接在庞大的 option chain 上自由编程,而是引入 OQL 这种领域中间表示,让模型先充当语义解析器,再交给确定性执行器实例化策略。这个设计很关键,因为期权组合一旦缺少明确的结构化语法,模型就极容易在约束、逻辑和执行细节上出错。两篇论文一起看,得到的结论很清楚:LLM 想进入量化流程,必须先被结构化。
  • 多 agent 分歧不一定是噪声,也可能是高价值的补充信息
  • 自然语言到交易执行之间需要一个强约束的编译层
  • 金融 LLM 最危险的失败模式,是看起来合理但无法验证

值得肯定的地方,是它们都在主动降低 LLM 的自由度

企业披露分类论文值得肯定的一点,是它没有把“让模型自己投票”当成答案,而是显式学习什么样的 agent disagreement 更有信息。这种设计对实务很友好,因为团队通常不会只部署一个模型,而是会面对多 prompt、多版本、多解释风格的输出。如果没有聚合层,这些输出只会增加噪声和运维复杂度。
OQL 论文同样有现实价值。作者没有神化 LLM 的自由生成能力,而是把它限制在 semantic parser 的角色里,再通过语法规则和执行引擎接管真正高风险的实例化过程。对期权这种高维、强约束市场来说,这种 neuro-symbolic 路线比直接让模型写策略代码稳健得多。它把错误暴露得更早,也更便于做审计和回放。
  • 聚合层让多模型输出从运维负担变成研究资产
  • 中间表示层能显著降低期权策略执行错误
  • 限制 LLM 自由度,反而更接近真实金融工作流

但从实验成功到生产可用,中间还有三道门没过

第一道门是标签真实性。企业披露分类论文最终仍然把 next-day return direction 当成监督目标,这在金融里很常见,但它容易把公告理解能力与短期市场噪声混在一起。即便聚合器比单个 agent 更强,也不代表它已经抓住了稳定可交易信号。第二道门是样本外迁移,公告语气、监管口径和市场制度变了以后,聚合策略未必还能成立。
对期权策略论文来说,真正困难的不只是 semantic parsing,而是执行后的真实成交、滑点、流动性和 Greeks 变化。模型能把“找一个 delta-neutral Iron Condor”翻译成合规的 OQL,不意味着这笔策略在真实盘口里就具有可实现的收益风险特征。也就是说,这组论文最大的价值是给出了一条正确的系统设计路线,而不是证明 LLM 已经学会了稳定赚钱。
  • next-day return 这类标签会把语言理解和市场噪声混在一起
  • 结构化语法正确,不等于交易结果就可兑现
  • LLM 量化系统真正缺的是执行审计,而不是更长的提示词

对量化团队的真实启发

如果团队想把 LLM 接进量化流程,更稳的顺序应该是先建聚合层和编译层,再谈大规模上线。对于文本任务,应该显式记录各 agent 的标签、置信度、理由和分歧模式,把它们作为二级特征,而不是只保留最终投票结果。对于结构化交易任务,应该建立像 OQL 这样可以检查语法、约束和执行语义的中间表示,而不是让模型直接产生命令或代码。
更重要的是,所有 LLM 金融输出都应该被视为“待审查提案”,而不是“直接可执行答案”。当团队开始这样看待 LLM,它才会真正从营销工具变成生产力工具。金融里的高风险流程不怕模型说得不够华丽,怕的是模型说得太像那么回事,却没人知道它到底哪一步错了。
  • 文本任务先建聚合层,结构化交易任务先建编译层
  • 保留 agent 分歧和中间语义,比保留最终答案更重要
  • 把 LLM 输出当成待审查提案,才是金融里最稳的使用姿势

关键结论

  • 金融 LLM 流程需要聚合层和中间表示层,而不是直接自由生成执行结果。
  • 多 agent 分歧只有被结构化利用,才会从噪声变成信号。
  • 更强的自然语言能力不自动等于更强的交易能力,执行审计仍然是核心门槛。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105