这篇文章最值得优先关注的要点是什么？

类别不平衡不能只靠技术补丁解决；标签、评价和阈值要一起设计；交易目标决定你该偏向哪种错误类型

读这篇文章时，建议优先看哪些部分？

建议优先阅读：为什么这个问题值得先想清楚、更稳的处理方式是什么。

学习路径课程总览课程目录文章技巧我的

机器学习量化类别不平衡量化标签机器学习量化模型评价

量化标签里类别不平衡怎么处理？不是简单过采样就能解决

讨论量化机器学习中类别不平衡问题的处理方式，帮助研究者避免在标签设计和评价阶段踩坑。

2026-03-287分钟

在很多量化分类任务里，真正显著的上涨、下跌或异常事件本来就很少见，这会让模型容易学会“多数类保守策略”而不是有效识别少数关键信号。

如果只是机械做过采样或调权重，却不改评价指标和决策阈值，模型看起来精度可能提高，实际交易价值却未必更好。

不平衡是目标设计问题也是训练问题
评价指标必须和交易目标一致
只做过采样常常不够

更稳的处理方式是什么

更稳的做法是从标签定义、采样方式、评价指标和交易后果一起设计处理方法，而不是把不平衡当成纯算法问题。

类别不平衡的关键，不是让数据看起来平，而是让模型更关注真正重要的少数事件。

关键结论

类别不平衡不能只靠技术补丁解决
标签、评价和阈值要一起设计
交易目标决定你该偏向哪种错误类型

返回全部文章

机器学习量化里的标签周期怎么选？很多模型不是学不好，是标签设错了

标签定义决定了模型在学什么，不先想清楚这一点，后面所有调参都可能跑偏。

量化数据里的平稳性和漂移到底在影响什么？

很多模型突然变差，不是代码坏了，而是输入数据的统计结构已经换了。

关联课程

如果你想把这篇文章里的方法系统化学习，可以从这些课程继续深入。

入门基础体系新手友好

查看详情

AI量化基础课程班

适合零基础或弱基础学员，覆盖 Python 入门、交易理念、期货市场基础、策略编写、回测测试、结果分析与 CTA 模拟/实盘对接。

4.9 (2120评价)2120人学习12小时6节

适合零基础或弱基础学员，覆盖 Python 入门、交易理念、期货市场基础、策略编写、回测测试、结果分析与 CTA 模拟/实盘对接。

AI量化基础课程班

适合零基础或弱基础学员，覆盖 Python 入门、交易理念、期货市场基础、策略编写、回测测试、结果分析与 CTA 模拟/实盘对接。

AI量化全流程高级班

以策略闭环为目标，打通模型优化、增量学习、自动化部署和智能风控的完整链路。

4.9 (234评价)856人学习12小时6节

以策略闭环为目标，打通模型优化、增量学习、自动化部署和智能风控的完整链路。

AI量化全流程高级班

以策略闭环为目标，打通模型优化、增量学习、自动化部署和智能风控的完整链路。

继续阅读

机器学习量化

把 LLM 当成时间切片之后，价格发现问题更像文本聚合成本，不像模型突然开悟

这篇论文最值得看的地方，不是它又证明了大模型能预测收益，而是它把冻结 checkpoint 解释成“某个时间点的公共文本压缩体”，于是收益预测就不再像神秘能力，更像信息聚合摩擦。

机器学习量化

把示范轨迹压成“策略原型”之后，强化学习交易终于少了一点拍脑袋

这篇 AAAI 论文没有继续在手工 regime 标签上打补丁，而是尝试先把示范轨迹离散成可复用原型，再让代理做选择和微调，思路比常见的“趋势/震荡二分类”更整齐。

机器学习量化

组合 RL 如果只奖励收益，最后学到的通常不是风险约束而是侥幸

这篇风险调整型 DRL 论文最值得看的地方，不是它又堆了几个 agent，而是它承认：只靠单一 reward，强化学习学出来的往往不是你以为的风险偏好。