陆方点头。
陈默站在旁边,一直没说话。
等周寻讲完,他才开口:
“第二条呢?”
周寻走到白板前,写下:
铁律二:奥卡姆剃刀——如无必要,勿增实体
他转过身:
“什么意思?在效果相近的情况下,永远选择更简单的模型。”
他指着陆方上周那条“完美曲线”:
“陆方那条线,为什么可能是过拟合?因为参数太多。他把动量因子的回溯期从6个月优化到5个月零3周,把估值因子的阈值从30%分位数调整到27.5%,把状态识别的波动率阈值从90%分位数改成88%。”
他顿了顿:
“这些数字,有经济含义吗?5个月零3周,和6个月有什么区别?27.5%和30%有什么区别?没有。它们只是让曲线更漂亮。”
他看着所有人:
“真正的规律,应该是简单的。如果两个策略收益差不多,选参数更少的那个。如果两个参数差不多,选逻辑更简单的那个。”
他走到白板前,画了一个天平:
```
复杂模型 简单模型
参数多、拟合好 参数少、泛化强
\ /
\ /
选哪个?
```
他放下笔:
“答案:在效果相近时,选简单的。”
小林又举手:
“周老师,那如果简单模型的效果比复杂模型差很多呢?”
周寻看着他:
“那就用复杂模型。但前提是,它的复杂度必须有合理的解释。你不能说‘因为加了这五个参数,收益提高了3%’就完事了。你得说清楚,这五个参数背后的逻辑是什么,为什么它们能让模型更好。”
他顿了顿:
“如果说不清楚,那就还是简单的。”
---
上午十点,讨论进入细节。
陈默走到白板前,指着那两条铁律:
“这两条,从今天开始,是默石的铁律。任何人都不能违反。”
他看着周寻:
“样本外数据,谁来保管?”
周寻想了想:
“最好由一个人专门负责。这个人不参与策略开发,只负责保管数据和跑最终检验。”
陈默扫了一圈办公室。
六个人。有的在写代码,有的在研究因子,有的在整理数据。
他的目光停在赵姐身上。
“赵姐。”
赵姐抬起头。
“这个任务,交给你。”
赵姐愣了一下:“我?我不懂量化……”
“不用懂。”陈默说,“你只需要做一件事:把那部分样本外数据,单独存起来,谁也不给。任何人要跑样本外测试,必须通过你。你只负责执行,不负责判断。”
他看着赵姐:
“你是公司的财务,最清楚钱是怎么来的。现在,你要帮我们守住另一笔财富——数据的清白。”
赵姐沉默了几秒。
然后她点了点头。
“好。我干。”
陈默又看向陆方:
“陆方,你负责把回测框架改一下。以后跑回测,必须指定‘训练集’和‘样本外’。系统要自动禁-->>
本章未完,点击下一页继续阅读