相比问这个问题的人应该是刚入行数据分析的,那我就以过来人的经验,说说入行数据分析师3年的成长要点和规划。
为什么要定义3年呢?这个行业基本3年内都是助攻,偶尔能成为主攻,助攻基本都是提取数据、处理数据、核对数据、写常规的分析报告,基本很少参加项目的讨论。
去看招聘信息时,这个时间内的分析师还是以技术、工具为主,因此3年内大家大部分时间都集中在工具、技术的研究,没办法,要先活着,得有份工作,3年后许多分析师才慢慢会有自己的思考和职场焦虑。
下面的几个点,也是我曾经用到的一些要点和思考,欢迎交流
一、断章取义(用数据说谎)
经常看到一些人写文章,大多数人引用别人的数据,用一张看似完美的图表,来疯狂做自己的观点输出,然而你仔细看看数据报告的背景she'ji、数据的来源、统计的口径、时间维度等,你会发现他的观点其实是在自圆其说
举个栗子:都说转行AI即可年薪50万,转行数据分析即可30万,市场需求几千万人
纸箱客虽然没有从事过数据分析师这项工作,但既然题主发问,纸箱客斗胆将自己的理解进行分享。
一、目前企业尽管有数据分析师这个岗位,但基本上都是刚刚起步,数据的处理和分析还是比较落后,这正好给了即将从事或已从事这个岗位的职场人机会和空间。
也许有人会说:我们单位有数据分析部都很多年了,你纸箱客凭什么说是刚刚起步?纸箱客只是分享自己的观点,无意去评论哪个企业。
纸箱客认为目前的数据分析充其量是好“统计”。将原来很长一段时间的数据搜集,整理,然后通过很长时间的计算、分析得出建议或结论。这已经违背了数据应用的最基本要求:那就是一定要低时延或无时延。
举个例子:医生给病人看病,一定是需要即时的检验数据,最起码也是当天的,才能做出精准的判断和分析,确定病人此时此刻的身体状态。如果用昨天的数据行吗?不行,一定会误诊。
企业也是一样,需要的是今天或此时此刻的数据,那么你怎么获取数据?这些数据用什么承载工具?通过什么快速的分析?分析的结果是多少分钟呈报到决策者?数据的时延性是多长?
毕业后就开始从事数据分析师工作,第一家公司给了我入门的机会,同时也培养了我作为数据分析师应该具备的技能,让我在后面的工作受益匪浅。总结一下就是:
1、先学会从数据库取到目标业务数据,就是要会sql。这一步很重要,不会自己取数,会吃大亏,因为别人并不完全理解你想要什么数据,往往拿到的数据用不符合要求。
2、理解业务需求,明确到底要采用什么数据分析方法,如果自己没什么头绪,就需要多向公司前辈多请教咯,还有搜索相关案例。
3、熟练应用办公软件,特别是PPT和excel,做分析报告不可或缺的。
4、会写数据分析报告。
1、 理论基础
作为一名合格的数据分析师,你需要有应用数学、统计学、数量经济学专业数学知识背景。主要的学科知识背景需要有高数、线性代数、数理统计与概率论、计算机基础、统计学等相关课程的学习,这些理论知识是背景支撑,不是都要面面俱到的,遇到比较困难问题时能够查阅相关书籍资料能弄明白即可。
2、技能
Excel等办公软件,Python或R编程语言,常用用作数据分析处理的工具主要有spss、r、python、sas、Matlab、Eviews、ExcelVBA、IBM等几种工具我们至少要学会一种,常用的数据库有access、Oracle、sql server、mysql、mangodb等选择其一学习(建议mysql或者sql serve)。数据挖掘算法,是一名中高级数据分析的必备技能,也是数据建模、数据挖掘的必备知识,常用的算法有决策树、回归方程、聚类分类、关联规则、线性判别法、贝叶斯分类器、Knn算法(k近邻算法)、人工神经网络(ANN=Artificial Neural Networks)、支持向量机(SVM)等常用算法,不是一开始每一个算法都会的,需要慢慢积累,学以致用即可。
【1】找到如何通过数据衡量产品。对于同一产品,针对不同的场景需要要的指标可能又是不一样的。比如说 Uber 在初期,有多少司机(供给方)可能是一个很重要的指标,而发展一段时间之后可能是交易量。
【2】找到如何可以驱动产品的指标。
对于同一产品,针对不同的场景需要要的指标可能又是不一样的。
【3】跟产品经理、工程师等合作寻找改进产品的机会。
【4】帮助产品做决策。在互联网行业,任何时候都有几十上百甚至上千个事情需要做的,那么哪个是最重要的、最需要解决的?哪些改变是有可能带来产品的改进的?这些都需要你的帮助。