高级策略闭环实盘闭环
查看详情AI量化全流程高级班
以策略闭环为目标,打通模型优化、增量学习、自动化部署和智能风控的完整链路。

4.9 (234评价)856人学习12小时6节
以策略闭环为目标,打通模型优化、增量学习、自动化部署和智能风控的完整链路。
¥6,999
基于原论文《Learning to Aggregate Zero-Shot LLM Agents for Corporate Disclosure Classification》,讨论为什么公告理解里更值得沉淀的是跨代理分歧特征,而不是简单投票。
如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。
这篇论文最值得看的地方,不是它又证明了大模型能预测收益,而是它把冻结 checkpoint 解释成“某个时间点的公共文本压缩体”,于是收益预测就不再像神秘能力,更像信息聚合摩擦。
这篇 AAAI 论文没有继续在手工 regime 标签上打补丁,而是尝试先把示范轨迹离散成可复用原型,再让代理做选择和微调,思路比常见的“趋势/震荡二分类”更整齐。
这篇风险调整型 DRL 论文最值得看的地方,不是它又堆了几个 agent,而是它承认:只靠单一 reward,强化学习学出来的往往不是你以为的风险偏好。