当前位置:
首页 > 小哲日记 > [2015.08.31]小哲谈谈大数据时代的思考

[2015.08.31]小哲谈谈大数据时代的思考

“大数据是被逼出来的”,这是百度CEO在《杨澜访谈录》里提到的一句话,没错,在如今数字信息时代以及移动互联网时代的催生下,数据量越来越大,如果这些数据被很好的人工智能所识别并加以利用,它那就能很好的造福社会。
老例子还是再提一下,沃尔玛通过大数据发现啤酒和幼儿尿布被很多人同时购买,发现大叔们都是这些消费的产生者,通过把啤酒和尿不湿的货交放在一起,销量提高特别明显。再说一个沃尔玛的例子,超市在飓风季节会准备手电筒雨衣等产品给消费者购买缓解不时之需,但是大数据显示购买这些产品的人大多数会同时购买蛋挞来吃,同样把货柜放在一起提高了销量,但是这背后的原因是无人可想象和联系上的;也就是说,大数据是真实行为数据产生后进行分析,他们有的关联可能是还不曾被人们知道的东西。
大数据在如今的时代会被有意的生产出来,百度的李彦宏是这么说的,也是这么做的。通过百度后台数据,可以知道同一时间百度地图GPS申请量,就可以知道景点的热力指数,大家就可以通过数据的表现来优化旅游行程。和大家息息相关的例子就是淘宝,每个人看到的淘宝页面都是不同的,因为淘宝会根据你看过什么、你关注过什么、你买过什么之类的得到关键词来推送给你想看到的商品,这样你方便了,它销量也高了。
小哲再谈谈大数据和隐私的关系,什么才是大数据,什么才是隐私。如果追述到你本人,这就是隐私,在成千上万的人之中,这些大数据收集方,例如BAT三巨头,他们通过出售个人信息是没有太大利润的,同时道德和法律风险太高,同时这样也不是大数据的意义,大家需要分清楚“大数据”和“大量数据”的区别,大数据之所以是大数据,这些数据是被特意生产,例如智能牙刷上传和收集唾液成分;同时这些数据不是躺着就可以了,他们要被分析、整理、关联,最终得出想要研究的结论。所以,这些数据是谁产生的并不重要,重要的是大众行为分析的结果,大数据公司为了保证信息的准确,所以是谁产生的数据对准确性有影响,但是一旦能确定准确性,大众的隐私其实并不影响大数据分析的结果。说了一大堆,其实意思就是说隐私保护和大数据分析不矛盾。
圆周率可以计算出圆周长度,但目前的圆周率是无限小数的;无限接近正确,大数据也是如此。如果把分析模型建立得足够完善,那结果就可以被预测,就好像上届世界杯的结果被百度大数据100%计算准确,奥斯卡颁奖结果24个奖项分析正确23个一样。是有事情都可以分析个所以然出来。好似双色球的分析,别搞错了,和概念无关;如果已知摇号箱里灰尘的数据,已知每个球在重量上的微小差异,已知摇奖现场空气的温度和适度,已知摇号箱里各个位置的弹跳角度和搅拌器的运动速度等等;计算机模拟数据越是接近真实,结果就越准确。
目前大数据只是时代发展的初期,我们的日常行为只有小部分被数据化,身边的中小型企业还很少通过购买大数据分析结果来指导生产和销售、政府决策也很少用大数据分析的结果;但这个时代会越来越发展,大数据时代会影响人类发展的脚步,更多的东西只要被拿来分析,知道哪些事物可以产生关联就可以反向推演出它们为什么会这样。小哲觉得人类的未来无限光明。

打赏 赞(0)
微信
支付宝
微信二维码图片

微信扫描二维码打赏

支付宝二维码图片

支付宝扫描二维码打赏

luozhe99

IT从业人员,科技控,烧脑剧迷。 ——如果过去还值得眷恋,别太快冰释前嫌。

网友评论7

  1. 支持博主

    2015-09-03 下午10:34 [回复]
  2. 说的好

    2015-09-03 下午10:34 [回复]
  3. 头像
    板凳
    御坂网络:

    大数据就是对数据的分析,也就是说如果能确定影响未来的所有条件,就能预测自己未来了.当然这是不可能的...
    话说我的名字能吸引博主你的回访咩.

    2015-09-01 下午5:22 [回复]
    • 呵呵,楼下的那个朋友之前叫“网络兼职”你说是不是没办法让我回访~ 哈哈  我经常去你那 但是有时候偷懒没留言

      2015-09-02 上午8:57 [回复]
      • 其实留不留言无所谓的,我留言也只是为了推广网站让其他人知道.

        2015-09-03 下午12:46 [回复]
  4. 头像
    沙发
    网上兼职:

    来访一下哈!

    2015-08-31 上午11:15 [回复]
    • 你这名字,我就没有回访的勇气

      2015-08-31 上午11:16 [回复]

发表评论

头像
表情
还能输入210个字