负责任的讲,大数据需要学习统计学知识。
目前大数据仍属程序员范畴,但带有强烈的数据分析统计的属性,也和数据挖掘关系密切。虽说日常工作也是写代码,但与Java不同的是,有时候需求提出方都不明白数据可以统计哪些指标,怎么样统计来的数据更科学,更有代表性。不像Java端有项目需求说明有产品经理提供明确的产品原型和逻辑,丢给大数据端的需求往往就一句,分析一下这数据~(不否认也有一些明确的统计,比如总量,PV,UV之类)
上级领导,运营方更希望你主动去分析挖掘数据,提供一些参考和价值,这时候你完全不懂统计学知识,要瞪着数据让它自己出需求吗?你连方差,波动,归一化,四分位等等都不了解,怎么去清洗数据,怎么做好自己的工作。
有些做大数据的人只把自己定位为码农,成长就会很慢,要主动把自己定位为数据分析师,学习统计学知识,一可以做好本职工作,二来可以进军机器学习领域,一举两得。
当你发现自己的统计学知识让你大数据工作有了门路,获得公司领导的认可和夸赞,花费的个把月时间又算得了什么呢。
加油吧,每天进步一点点,未来就会大不同。
目前来说简单的统计公式要知道,如果涉及到复杂算法可能是需要了解统计学的一些知识,但是一个大数据开发工程师 可以不用多么的掌握统计学一样是一个大数据开发