张椅子坐下,隔着借阅看着她。
「找你帮个忙,赚点外快。」
苏微放下手里的线装书和胶水,拿过旁边的一块干毛巾擦了擦手。
「说。」
「这个软盘里,有两万条杂乱的文本数据。」
陈拙指了指那个黑色的塑料方块。
「里面全是人为录入的标签,有很多拚写错误,乱码和无意义的符号。」
他看着苏微的眼睛。
「机器的算法剔除不了这种没有逻辑规律的脏数据,需要人工一行一行地看,把有错误的行删掉,保留格式正确的。」苏微看着那个软盘,没说话,在心里评估工作量。
「两万条,如果速度快,大概明天。」
陈拙语气平缓。
「明天下午六点之前给我,五十块钱。」
苏微伸手拿过那个软盘。
翻看了一下背面。
「你们这算什麽?外包的外包?」
苏微嘴角微微动了一下。
陈拙笑了笑。
「算是吧,草班子遇到点算力解决不了的体力活。」
苏微把软盘放进自己马甲的口袋里。
「这活儿我接了,但图书馆的电脑不能乱插软盘,我得晚上回宿舍,借室友的电脑看。」
「可以,明天下午我来拿。」
陈拙站起身,准备走。
「等等。」
苏微叫住他。
陈拙回过头。
「如果是文本文档,这两万条数据全是连在一起的。」
苏微看着他。
「我之前在相关的书里看过一点这些,我删掉一行,怎麽保证你们导入的时候,行数对应的图片不串位?」陈拙看着苏微,眼底闪过一丝惊叹。
这姑娘不仅手脚麻利,脑子更是极其清楚。
「我在那个文本里,已经写了一段宏。」
陈拙回答。
「你不用直接删文字,遇到有乱码的那一行,你只需要在最前面敲一个数字0,遇到正常的,敲1。」他稍微停顿了一下。
「格式我会回去重新匹配,你只负责分辨对错就行。」
苏微点了点头。
「明白了,明天下午六点,来这儿找我。」
她重新拿起胶水,低头继续修补那本线装书。
第二天傍晚。
陈拙准时出现在老图书馆。
苏微把软盘推给他。
眼底下有淡淡的黑眼圈,显然昨晚熬了夜。
「弄完了,一共删了三千四百一十二条脏数据。」
苏微的声音有些疲惫,但依然乾脆。
陈拙拿过软盘,从兜里掏出一张五十块的纸币,放在桌上。
「辛苦。」
苏微把钱收起来,放进抽屉里。
「钱货两清。」
当天晚上。
216宿舍。
楚戈把陈拙拿回来的软盘插进电脑。
读取出那个被苏微标记过的数据文本。
他写了个最简单的读取脚本,只抓取开头标记为1的数据。
几秒钟後。
一万六千多条乾乾净净、没有任何乱码的测试数据被提取出来。
楚戈把这些数据导入那个跑通了的底层程序。
回车。
-->>
本章未完,点击下一页继续阅读