跟您确认一下,这个问题什么时候能解决?”
千分之三的丢失率。
林辰脑子飞快运转。他记得上周的监控报告里,订单同步的成功率是99.98%,丢失率只有万分之二。这才几天,怎么就上升到千分之三了?
“王总监,这个数据是最近才出现的吗?”
“就这三五天。之前还好,最近突然升高。我们的监控显示,大部分丢失集中在晚上十点到凌晨两点,也就是你们的发版窗口期。”
发版窗口期。
林辰明白了。这是重构过程中,频繁发布导致的数据不一致。虽然每次事故后都有数据补偿机制,但有些极端情况,补偿也会失败。
“这个问题我们已经在处理了。”林辰尽量让声音平稳,“最近我们正在做系统重构,有些临时性的波动。预计一周内,等重构完成,数据同步的稳定性会有质的提升。”
“一周……”王磊在电话那头沉吟,“林总,不是我不相信您。但我们这边压力也很大。财务部门已经投诉好几次了,说对账对不上。刘总的意思,如果三天内看不到明显改善,我们可能要考虑……临时切换一部分流量到备用系统。”
三天。
比李铭给的一周,还少了四天。
“王总监,三天太紧了。重构是个系统工程,就像做手术,不能做到一半就缝合。”林辰试图争取时间。
“我理解,但我也有我的难处。”王磊语气强硬了些,“这样吧,林总。我也不为难您。三天,您给我们一个详细的问题分析报告和解决时间表。如果能让我们看到明确的路径,我们可以再等等。如果看不到……”
他没说完,但威胁的意味很明显。
“……好,三天。”林辰咬牙,“三天后,我把报告给您。”
“那期待您的报告。再见。”
电话挂了。
林辰放下手机,手心有些出汗。百盛是星河科技最大的客户,如果丢了,不止是八百万合同的问题,更是对整个公司信誉的打击。到时候,不用陈明远动手,李铭就会第一个让他滚蛋。
他走到办公区,拍了拍手。
“所有人,停一下手里的活。出事了。”
二十多号人抬起头,看向他。
“百盛那边,发现订单数据有千分之三的丢失,给了我们三天时间解决问题,否则就要切流量。”林辰语速很快,“问题集中在晚上十点到凌晨两点,也就是我们的发版窗口期。谁负责那个时段的发布?”
几个组长面面相觑。
“上周是我。”一个叫刘凯的架构师举手,“但每次发布我都严格按流程走,发布前备份,发布后验证,没发现问题啊。”
“发布日志调出来。”林辰走到刘凯的工位,“系统监控也调出来,我要看那个时间段的所有异常。”
屏幕亮起,日志如瀑布般滚动。林辰盯着屏幕,眼睛快速扫描。系统也在辅助分析,将可疑的条目高亮标记。
“这里。”林辰指着一条日志,“晚上十点二十三分,订单服务重启,导致正在处理的二十三个订单状态丢失。数据补偿机制启动了,但补偿失败了——原因是补偿服务本身的数据库连接超时。”
他又指向另一条:“十一点零七分,支付服务发布,新老版本同时运行了三分钟。这期间,有部分订单被老版本处理,部分被新版本处理,状态不一致。数据同步时发生冲突,有七个订单被标记为‘异常’,需要人工处理。”
一条,又一条。
总共发现了十三个问题点,分布在过去五天的发布记录里。每个问题单独看都不大,但累积起来,就造成了千分之三的丢失率。
<-->>
本章未完,点击下一页继续阅读