天罡的大数据重审工作,是将所有的玩家数据进行挖掘、分析和利用,要将繁杂的大数据变成完备的高质量数据集,以支撑决策,清洗与去噪,十分必要。
诚如蔡鹏予黑进霸领系统,寻找有关莫菲的资料,以及搜查网络,想求些关于这个女人的公开数据,最后,却只得到一些皮毛信息。原始数据的不完整、不一致、异常、重复等等问题,也是在所难免,毕竟,就像更早之前,蔡鹏予跟安雅说的那样,大数据的处理,本来就跟垃圾处理差不多,谁也不可能一下子就在垃圾中掘到宝,面对一座垃圾山,还是得一点点扒拉、分类,才有可能看到其最后的价值。
可,谁来保证大数据的真实性呢?谁又敢说自己没在网络上造过假?
好比林妙妙黑进凌空手机,篡改他的手机型号,简简单单的“障眼法”便可误导算法,从而使机器以为凌空是“好欺负”类型,于是对其大数据杀熟。网络上“噪声”也随处可见,很多时候,倒并不是普罗大众跟林妙妙似的刻意为之,而是,人的本性使然——没有谁,会心甘情愿、毫无保留地将自己完全暴露——这是连动物,都知道的保护自己的法则。
因而有关大数据清洗的工作量就变得十分庞大与不易,加上天罡人手严重不足,10月7日早晨,蔡鹏予带领寥寥数个小伙伴,刚起了个头,就已是千丝万缕地理不清。
Loading...
未加载完,尝试【刷新】or【关闭小说模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.lengleng.cc
(>人<;)