大数据的涵义,包括这几个方面,一个是容量大,通俗地说就是信息量很大。比如在我们的生活中,现在每个人一天所接触的信息量(通过手机等),可能都是20年前平均每个人接触信息量的几十倍,那么一个范围内这么多人接触的这么多信息,就需要去分析——比如在头条上,只有这样的用户数据分析,才能知道用户想看什么。第二个是数据的种类多,比如可能有语音、图像、文本等各类数据,或者是图像数据的类型可能有很多种,比如我们看的小视频、图文的信息,以及听的广播等等,这些合在一起,构成了我们每个人所接触的信息合集,用户画像就是这么做出来的。 第三个是大数据的传输和分析速度,往往要求比较高。这个也很容易理解,因为这么大量的信息,如果太慢的话就会“卡”,所以才会在4G发展后,还要求发展5G。未来下载一部电影也许只用一分钟,这就是传输速度的要求,但是在大数据的分析里面还要求分析速度跟得上,比如自动驾驶要铺开的话,就得靠快速的分析,才能让汽车自动快速地反应控制。 第四个可能较少提及,就是数据还要有一定的可变性,这个主要涉及管理数据的过程,涉及比较多的专业知识就不展开。最后一个,就是数据量大且面广,但是有用的数据还得保证数据的真实性,如果有很多虚假的数据会造成干扰。
欢迎关注【情报前沿阵地】,将分享更多产业信息情报与前沿科技知识。若有其他问题请在评论区留言,欢迎在评论区发表自己的不同观点。
大数据,顾名思义,就是量很大的数据,有多大呢?其实也没有太明显的界定,比如传统你处理几百条数据,用excel就可以了,如果几千条呢?或许excel也还行,但是几万条几百万条几亿条数据呢?这时候就需要使用大数据技术了。
大数据在我们生活场景有很多的使用,比如你手机上的TB,会记录你的浏览记录,购买记录,然后为你建立用户画像,不光是你的,而是所有用户的,每天亿级的数据量,然后根据你和你同类用户的消费行为和浏览行为在首页上给你推送相关商品链接,这叫“个性化推荐”。
比如你开车时,如果打开地图路况的话,也会看到有些路段是红的,有些是绿的,这种就是地图app采集了每次的打点信息分析你的速度,从而分析路段的拥堵情况,当然,也是当前所有用户的,所以它可以得到全路网的交通情况。
既然都说到这儿了,那就再说一点吧,其实啊,现在大部分公司所谓的大数据,基本靠吹!90%所谓大数据公司,其实是没有数据的,或者数据根本没有达到那个量级。
还有头条上的文章,动不动喜欢加上大数据云云,其实就是拿到别人的统计结果就开始写文章蹭热度,讲真有点看不下去。
聚集和聚焦,通过海量数据配合模型分析行为,预测未来发展趋势