就爱来小说网

第244章:确立“样本外”测试与简化原则(2/4)

    陆方点头。

    陈默站在旁边,一直没说话。

    等周寻讲完,他才开口:

    “第二条呢?”

    周寻走到白板前,写下:

    铁律二:奥卡姆剃刀——如无必要,勿增实体

    他转过身:

    “什么意思?在效果相近的情况下,永远选择更简单的模型。”

    他指着陆方上周那条“完美曲线”:

    “陆方那条线,为什么可能是过拟合?因为参数太多。他把动量因子的回溯期从6个月优化到5个月零3周,把估值因子的阈值从30%分位数调整到27.5%,把状态识别的波动率阈值从90%分位数改成88%。”

    他顿了顿:

    “这些数字,有经济含义吗?5个月零3周,和6个月有什么区别?27.5%和30%有什么区别?没有。它们只是让曲线更漂亮。”

    他看着所有人:

    “真正的规律,应该是简单的。如果两个策略收益差不多,选参数更少的那个。如果两个参数差不多,选逻辑更简单的那个。”

    他走到白板前,画了一个天平:

    ```

    复杂模型 简单模型

    参数多、拟合好 参数少、泛化强

    \ /

    \ /

    选哪个?

    ```

    他放下笔:

    “答案:在效果相近时,选简单的。”

    小林又举手:

    “周老师,那如果简单模型的效果比复杂模型差很多呢?”

    周寻看着他:

    “那就用复杂模型。但前提是,它的复杂度必须有合理的解释。你不能说‘因为加了这五个参数,收益提高了3%’就完事了。你得说清楚,这五个参数背后的逻辑是什么,为什么它们能让模型更好。”

    他顿了顿:

    “如果说不清楚,那就还是简单的。”

    ---

    上午十点,讨论进入细节。

    陈默走到白板前,指着那两条铁律:

    “这两条,从今天开始,是默石的铁律。任何人都不能违反。”

    他看着周寻:

    “样本外数据,谁来保管?”

    周寻想了想:

    “最好由一个人专门负责。这个人不参与策略开发,只负责保管数据和跑最终检验。”

    陈默扫了一圈办公室。

    六个人。有的在写代码,有的在研究因子,有的在整理数据。

    他的目光停在赵姐身上。

    “赵姐。”

    赵姐抬起头。

    “这个任务,交给你。”

    赵姐愣了一下:“我?我不懂量化……”

    “不用懂。”陈默说,“你只需要做一件事:把那部分样本外数据,单独存起来,谁也不给。任何人要跑样本外测试,必须通过你。你只负责执行,不负责判断。”

    他看着赵姐:

    “你是公司的财务,最清楚钱是怎么来的。现在,你要帮我们守住另一笔财富——数据的清白。”

    赵姐沉默了几秒。

    然后她点了点头。

    “好。我干。”

    陈默又看向陆方:

    “陆方,你负责把回测框架改一下。以后跑回测,必须指定‘训练集’和‘样本外’。系统要自动禁-->>

本章未完,点击下一页继续阅读