首先明确地说一点, 数据分析与数据挖掘无论是在职业上还是技术栈上并没有很明显的界限。两者的技术和工作内容存在很大的重合,比如数据分析也有很多时候用到数据挖掘的理论和模型,很多数据分析从业者使用SAS、R、SPSS就是一个很好的例子,另一方面,做数据挖掘项目时同样需要有人懂业务懂数据,能够根据业务需要提出正确的数据挖掘需求和方案,能够提出备选的算法模型,实际上这样的人一脚在数据分析上另一只脚已经在数据挖掘上了。
如果非要说有什么区别的话,我觉得可能数据分析更注重对已知事实的分析,即出现了某个业务现象,通过数据分析探索发生的原因,进而进行针对性地应对。而数据挖掘更注重在大数据中进行探索,挖掘潜藏在数据背后的业务规律,进而为业务发展寻找突破点。
回到题主关注的技术层面,针对数据分析师,需要掌握的技能有:概率论和统计学知识,能够熟练运用Excel、SQL,R、Python、SPSS等至少一门专业分析软件,注意是熟练运用,而且Excel是必备技能,如果做大数据分析的话,SQL,HIVE等也要比较熟练的使用,最后还有最最重要的一项,要有深刻的内部业务见解和外部商业分析能力,这是很多数据分析师的痛点和薄弱点,数据分析重在业务,不是技术,千万不要本末倒置!!!
数据挖掘入门门槛就要高一点了,不仅要具备基础的工程能力,还要具备一定的算法能力和业务经验,主要包括:
一、工程能力:
您是否想更好地了解传统数据与大数据之间的区别,在哪里可以找到数据以及可以使用哪些技术来处理数据?
这些是处理数据时必须采取的第一步,因此这是一个不错的起点,特别是如果您正在考虑从事数据科学职业!
“数据”是一个广义术语,可以指“原始事实”,“处理后的数据”或“信息”。为了确保我们在同一页面上,让我们在进入细节之前将它们分开。
我们收集原始数据,然后进行处理以获得有意义的信息。
好吧,将它们分开很容易!