这个问题思考了很久,作为过来人谈一谈,建议在看我这篇之前先去了解一下数据挖掘的概念和定义。
在学习数据挖掘之前你应该明白几点:
- 数据挖掘目前在中国的尚未流行开,犹如屠龙之技。
- 数据初期的准备通常占整个数据挖掘项目工作量的70%左右。
- 数据挖掘本身融合了统计学、数据库和机器学习等学科,并不是新的技术。
- 数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)
- 数据挖掘适用于传统的BI(报表、OLAP等)无法支持的领域。
- 数据挖掘项目通常需要重复一些毫无技术含量的工作。
如果你阅读了以上内容觉得可以接受,那么继续往下看。
学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司),一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了,一方面有利于抓住用户痛点和刚性需求,另一方面能够累计行业经验,使用互联网思维跨界让你更容易取得成功。不要在学习技术时想要面面俱到,这样会失去你的核心竞争力。
一、目前国内的数据挖掘人员工作领域大致可分为三类。
- 1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告。
- 2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。
- 3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。
二、说说各工作领域需要掌握的技能。
(1).数据分析师
作为有着两三年数据科学从业经验的过来人,我想结合自己一些数据科学浅薄的经验来这个问题。
从零开始学习数据挖掘,首先需要明白数据挖掘是做什么的?
百度百科中的定义为:数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,并且数据挖掘横跨多个领域,涵盖了统计学、数学、机器学习和数据库等,是一个交叉学科。
所以,学习数据挖掘需要学习多种知识。
如果是已毕业工作中的小伙伴,建议先从编程能力实现一些数据分析需求来入手。因为工作中可能没有太大块的学习时间,想在工作的同时学习,就要有一定工程能力满足老板的一些数据分析需求。适合数据挖掘的语言有编程语言python,以及偏统计的语言R,sas,数据采集语言sql等。python的优点是工作中懂的开发人员比较多,比较好沟通,近年来也是很火的语言。推荐的书籍:《跟老齐学python》,《笨方法学python》,《利用Python进行数据分析》等,网上的课程:
https://github.com/jackfrued/Python-100-Days
数据挖掘:What?Why?How?
这个问题思考了很久,作为过来人谈一谈,建议先看下以前的一些。
- 什么是数据挖掘?
- 怎么培养数据分析的能力?
- 如何成为一名数据科学家?
磨刀不误砍柴工。在学习数据挖掘之前应该明白几点:
- 数据挖掘目前在中国的尚未流行开,犹如屠龙之技。
- 数据初期的准备通常占整个数据挖掘项目工作量的70%左右。
- 数据挖掘本身融合了统计学、数据库和机器学习等学科,并不是新的技术。
- 数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)
- 数据挖掘适用于传统的BI(报表、OLAP等)无法支持的领域。
- 数据挖掘项目通常需要重复一些毫无技术含量的工作。
大数据分三大方向10大岗位,可以考虑大数据ETL工程师方向
关注我,我有分享数据分析相关的入门视频教程,到进阶视频教程,pdf教程+源代码