第4章 初步整理(4/4)
。
他继续工作。第三天晚上,他加班到十点多,终于将几个核心文件初步清洗完毕,生成了第一版“干净”的基础数据集。他按照要求,生成了数据概览报告,包括数据量、字段说明、缺失值比例、异常值处理情况,以及那个醒目的“‘交易类型编码’未知比例:14.8%”的红色警示框。
他把数据集、报告、以及详细的清洗过程记录文档打包,在第四天上午一上班,就发给了王海。同时在邮件正文里写道:“王组,天晟数据初步清洗完成,已发附件。核心问题已在报告中标红。请查收。”
几分钟后,王海回复了邮件,只有两个字:“收到。”