当前位置:
首页 > 小哲日记 > [2015.08.31]小哲谈谈大数据时代的思考

[2015.08.31]小哲谈谈大数据时代的思考

“大数据是被逼出来的”,这是百度CEO在《杨澜访谈录》里提到的一句话,没错,在如今数字信息时代以及移动互联网时代的催生下,数据量越来越大,如果这些数据被很好的人工智能所识别并加以利用,它那就能很好的造福社会。
老例子还是再提一下,沃尔玛通过大数据发现啤酒和幼儿尿布被很多人同时购买,发现大叔们都是这些消费的产生者,通过把啤酒和尿不湿的货交放在一起,销量提高特别明显。再说一个沃尔玛的例子,超市在飓风季节会准备手电筒雨衣等产品给消费者购买缓解不时之需,但是大数据显示购买这些产品的人大多数会同时购买蛋挞来吃,同样把货柜放在一起提高了销量,但是这背后的原因是无人可想象和联系上的;也就是说,大数据是真实行为数据产生后进行分析,他们有的关联可能是还不曾被人们知道的东西。
大数据在如今的时代会被有意的生产出来,百度的李彦宏是这么说的,也是这么做的。通过百度后台数据,可以知道同一时间百度地图GPS申请量,就可以知道景点的热力指数,大家就可以通过数据的表现来优化旅游行程。和大家息息相关的例子就是淘宝,每个人看到的淘宝页面都是不同的,因为淘宝会根据你看过什么、你关注过什么、你买过什么之类的得到关键词来推送给你想看到的商品,这样你方便了,它销量也高了。
小哲再谈谈大数据和隐私的关系,什么才是大数据,什么才是隐私。如果追述到你本人,这就是隐私,在成千上万的人之中,这些大数据收集方,例如BAT三巨头,他们通过出售个人信息是没有太大利润的,同时道德和法律风险太高,同时这样也不是大数据的意义,大家需要分清楚“大数据”和“大量数据”的区别,大数据之所以是大数据,这些数据是被特意生产,例如智能牙刷上传和收集唾液成分;同时这些数据不是躺着就可以了,他们要被分析、整理、关联,最终得出想要研究的结论。所以,这些数据是谁产生的并不重要,重要的是大众行为分析的结果,大数据公司为了保证信息的准确,所以是谁产生的数据对准确性有影响,但是一旦能确定准确性,大众的隐私其实并不影响大数据分析的结果。说了一大堆,其实意思就是说隐私保护和大数据分析不矛盾。
圆周率可以计算出圆周长度,但目前的圆周率是无限小数的;无限接近正确,大数据也是如此。如果把分析模型建立得足够完善,那结果就可以被预测,就好像上届世界杯的结果被百度大数据100%计算准确,奥斯卡颁奖结果24个奖项分析正确23个一样。是有事情都可以分析个所以然出来。好似双色球的分析,别搞错了,和概念无关;如果已知摇号箱里灰尘的数据,已知每个球在重量上的微小差异,已知摇奖现场空气的温度和适度,已知摇号箱里各个位置的弹跳角度和搅拌器的运动速度等等;计算机模拟数据越是接近真实,结果就越准确。
目前大数据只是时代发展的初期,我们的日常行为只有小部分被数据化,身边的中小型企业还很少通过购买大数据分析结果来指导生产和销售、政府决策也很少用大数据分析的结果;但这个时代会越来越发展,大数据时代会影响人类发展的脚步,更多的东西只要被拿来分析,知道哪些事物可以产生关联就可以反向推演出它们为什么会这样。小哲觉得人类的未来无限光明。

分享生活点滴,内容问题可与我联系。 斜杆青年:资深产品经理/网站工程师/科技爱好者/新媒体运营/自媒体写作人