学习计划|带你10週入门资料分析

「我是文组出身,可以学习资料分析吗?」
「我没有编程基础,可以成为资料分析师吗?」
「学习资料分析必须学习R和Python吗?」
… …
其实,资料分析没有想像中那么难,入门也没有那么多条条框框。
我认识的HR转资料分析,市场行销转资料营运的,大有人在。
资料分析重要的是问题的理解、分析的思路、分析的流程及结果的解读,工具和编程都是实现这些分析思路的手段之一。
不过优秀的资料分析师也并非几日能速成,但入门也有入门的捷径。
盘算了一下资料分析的入门知识,大体分为以下这些,只要拿出你大学时啃高数的状态,每周夯实一个基础,基本能学成。

学习大纲:

资料分析的思维和方法Excel进阶资料库理解和SQL入门数理统计学Python/R语言掌握资料分析软体应用
* 资料视觉化常见的业务分析模型业务理解和指标设计增长黑客:资料驱动增长

接下来,我将花一段时间在专栏里详细讲述每一块教程,学习地址 — — 拉到文章末尾。

第一週:培养资料分析思维

为什么资料分析思维很重要?
如果我们在分析一个问题前,思维缺失就像下面图中所表达的一样,往往不知道问题从哪里下手,即使拿到资料也是一脸懵逼。
所以我们要通过训练资料分析思维,帮助在遇到问题时,大家脑中能快速梳理出分析的切入点,甚至是分析的思路,这一点很重要。

常用的一些思维方式:

1、金字塔/结构化思维

把待分析问题按不同方向去分类,然后不断拆分细化,能全方位的思考问题,一般是先把所有能想到的一些论点先写出来,然后在进行整理归纳成金字塔模型。主要通过思维导图来写我们的分析思维。

2、公式化思维

在结构化的基础上,这些论点往往会存在一些数量关係,使其能进行+、-、×、÷的计算,将这些论点进行量化分析,从而验证论点。所谓指标体系,就是这么梳理得来的。
业务化思维
业务化即是深入了解业务情况,结合该项目的具体业务进行分析,并且能让分析结果进行落地执行。用结构化思考+公式化拆解得出的最终分析论点再很多时候表示的是一种现象,不能体现产生结果的原因。所以需要继续去用业务思维去思考,站在业务人员或分析对象的角度思考问题,深究出现这种现象的原因或者通过资料推动业务。
增加业务思维方法:贴近业务,换位思考,积累经验。

同时,这样的思维模式在一些特定业务场景下,还衍生出一些基础的分析方法,比如象限法、多维法、假设法、指数法、二八法、对比法、漏斗法,这个对未来构建分析模型都有帮助。

思维模型的好处是他能提供一种视角或思维框架,从而帮助你建立起观察事物和分析问题的视角。通过对思维模型的学习和训练,能提高你成功的可能性。

第二週:Excel技能进阶

学习Excel是一个循序渐进的过程
基础的:简单的表格资料处理、筛选、排序
函数和公式:常用函数、高级资料计算、数组公式、多维引用、function
视觉化图表:图形图示展示、高级图表、图表插件
资料透视表、VBA程序开发
按照我习惯的方法,先过一遍基础,知道什么是什么,然后找几个case练习。多逛逛Excelhome论坛,平常多思考如何用Excel来解决问题,善用插件。

函数和资料透视表是两个重点,结合业务场景来学习,可参考《谁说菜鸟不会资料分析》。

製作资料範本必须掌握的Excel函数

日期函数:day,month,year,date,today,weekday,weeknum。日期函数是做分析模板的必备,可以用日期函数来控制资料的展示,查询指定时间段的资料。

数据函数:product,rand,randbetween,round,sum,sumif,sumifs,sumproduct
统计函数:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs。统计函数在资料分析中具有举足轻重的作用,求平均值,最大值,中位数,众位数都用得到。
查找和引用函数:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata。这几个函数的作用不用多说,特别是vlookup,不会这个函数基本上複杂一点的报表寸步难行。
文本函数:find,search,text,value,concatenate,left,right,mid,len。这几个函数多半用在资料整理阶段使用。
逻辑函数:and,or,false,true,if,iferror。

资料透视表

资料透视表的作用是把大量资料生成可交互的报表,资料透视表具有这样一些重要功能:分类汇总、取平均、最大最小值、自动排序、自动筛选、自动分组;可分析佔比、同比、环比、定比、自定义公式。

第三週:学习资料库原理和SQL

做资料分析,资料从哪里来?资料库!怎么取资料?写SQL!
做资料分析,取数、清洗资料,基本都要依赖SQL。

初入门阶段,对于资料库不必精通,只需了解常用的资料库类型,能够在现有的表格里面查询出资料,能够更新资料对资料进行重编码,知道怎么增加添加资料,把资料变得规整就行。理解主键,索引等含义和用处。汇入汇出资料可以使用工具,分析资料可以使用ODBC或者其他的介面对资料库进行连接。取数的排序,做数资料交集并集,资料转换,资料表合并等这些,最好也能掌握。

这里我总结了几个核心技能:

技能一:学会用select语句添加栏位和找出需要的资料

直接给一个随时可以套用的万金油模板吧:
select cola,colb,colc into newtable from oldtable wherecola=’x’ and colb is not null;
基本上,学会这个就可以完全的查出大部分的资料了。
select后面是一个个的栏位,要哪个选哪个。有into意味着放到一张新表里面,没有就是查询出来。where之后的就是我们的条件,等于某个值,或者是不是空值,是最常用的几种查询方式吧。
还有一种select也用的非常多:select cola from oldtable group by cola;
这个语句是看看cola有多少种值的可能性。
select进阶学习,可能要讲讲join,union,以及多个查询组合成的嵌套查询,或者是子查询的模式,以及模糊查询。这个后面我会再花篇幅写出来给大家参考。

技能二:学会alter学会增加,减少栏位

alter可以做的事情很多,增加栏位,减少栏位,增加主键减少主键等等,非常常用。

增加栏位:alter table tablename add colname varchar;
这样就可以增加一个空栏位,varchar是一种资料类型。减少栏位:alter table tablename drop column colname;
这样就去掉了一个原有的栏位。

技能三:学会更新资料

大概常用的有两种,一种是更新成一个固定值:
update table set col=1;
另一种是从另一张表里面更新,这种方法,在处理一些小型资料的时候经常会汇出,然后汇入到资料库,就可以用:
update table set col=tableb.col from tablebwhere table.id=tableb.id;
里面table和tableb是两张表,然后通过两张表的id关联起来,学会这个书写结构就行。

第四週:数理统计学

统计学是资料分析师必备的基础知识之一,是一组用于汇总资料和量化给定观测样本域属性的工具。
单独的原始观察资料只是资料,还不能变为我们想要的资讯或知识。有了原始资料,那么接下来的问题是:
什么是最常见或可预期的观测?
观测的限制条件是什么?
资料是什么样子的?
回答这些问题,我们需要藉助一些统计工具来得出一些结论。藉助统计学,你的分析深度、专业度和科学性都会有很大提升。
所以这一周,我们需要掌握统计学的以下几大概念:

1.集中趋势(中数、众数、平均数)2.变异(四分位数、四分位距、异常值、方差)3.归一化(标準分数)4.正态分布5.抽样分布(中心极限、抽样分布)6.估计(置性度、置信区间)7.假设检验8.T检验

推荐书籍:吴喜之-《统计学·从资料到结论》

第五週:资料分析软体应用

有了资料分析思维基础,懂一些统计学知识之后,我们就可以着手开始相对专业的分析,用视觉化的方法探索资料的规律。

这一周,除了Excel,你需要掌握一个傍身的资料分析工具。

考虑到快速入门,这里暂时放一放SPSS、R、Python一类工具,先掌握BI工具的运用,帮助快速熟悉起资料分析的流程。知名的BI产品有Tableau,Power BI,还有国内的FineBI,网上都有体验版和免费版下载。处理好的资料拿来放BI分析,分分钟就能出很漂亮的视觉化,比Excel的图表高级多了,而且绝大多数人都能轻鬆上手。

BI需要掌握资料的连结,连不上资料怎么分析。还有仪錶盘Dashboard的概念,知道绝大多数图表适用的场景和怎么绘製,维度和指标的区分。一些资料的清洗,如果BI掌握得透彻也可以放BI处理,但不熟悉还是用SQL处理吧。

第六週:资料视觉化

视觉化看似是简单的步骤,但也是有造诣的。说白了是一种表达,资料分析结果表达的是否到位,领导是否认同,工资涨不涨,全靠这一纸dashboard(当然还有你「讲故事」的功力)。

如何选择最佳的图表类型?趋势性、相关性、分布性、周期性、地理位置分布性……
颜色和字体等细节样式方面,如何进行更加美观的调配。

布局设计原则,故事性布置视觉化仪錶板,报告的标题和结论注释,以及整体展现的逻辑性。

还有很多视觉化的陷阱,都是值得花一周探究的。

製作漂亮的视觉化一般有这样几个方式:
利用Excel内置的图表做一些常规的统计图。高级複杂的譬如动态图表,图表的筛选展示可以透过写VBA来实现;
透过R、Python一类的资料分析语言,调用图表功能包,呈现视觉化的资料,资料分析常用;
藉助Echarts、HighCharts、D3.js等开源的视觉化插件, 嵌入程式码,开发成插件包,视觉化工程师和前端开发常用;
视觉化最实用的场景就是大屏展示:**FineReport**有自主研发的HTML5图表, FineReport10.0更是开发了更加炫酷的大屏功能:近10个大屏3D特效、15种动态载入效果,以及联动炫酷效果。

FineReport

FineReport
之前写过一篇《6大类14款资料视觉化工具,学会其中2个就够了!》,可以参考下~

第七週:常见的业务分析模型

基于一些资料分析方法,如象限法、多维法、假设法、指数法、二八法、对比法、漏斗法,在特定业务场景下,还衍生了通用的业务分析模型,常用的有购物篮分析模型,RFM模型,漏斗分析模型,客户生命周期,以及预测、聚类分析等挖掘模型。
这一周我们要掌握常用的分析模型,最好能有深刻的认识,直接套用到实际的业务场景中,活学活用。

漏斗分析

第八週:Python/R语言掌握

到这一周,资料分析的入门之路基本上完成一大半。
本着提升自己,以及加大自己求职和面试的筹码,掌握Python或R绝对是加分项。
有关资料分析的编程语言有Python和R语言。R语言倾向于统计分析、绘图等。统计学家或者学统计学的喜欢用R语言,而我更青睐学习Python,因为Python是面向未来的语言,无论从流行度、可用性还是学习难度来讲,Python都是最好的入门语言。

当然,如果可以的话,再掌握一下R语言是最好不过的,学习嘛,永无止尽。

Python有很多分支,但我们学习的主题是资料分析,入门推荐《深入浅出Python编程》
从code academy开始学起,完成上面的所有练习。Code academy涵盖了Python基本概念。当完成了code academy练习之后,看看这个Ipython notebook:

其次,掌握三个库Numpy、Pandas、Matplotlib
Numpy是利用Python科学计算的基础包,对Numpy好的掌握将会帮助你有效地使用其他工具例如Pandas。包括N维数组,索引,数组切片,整数索引,数组转换,通用函数,使用数组处理资料,常用的统计方法等等。
Numpy Basics Tutorial,Index Numpy 遇到Numpy陌生函数,查询用法,推荐!
Pandas包含了高级的资料结构和操作工具,能使得Python资料分析更加快速和容易。包含series, data frams,从一个axis删除资料,缺失资料处理等等。
Pandas Basics Tutorial,Index Pandas 遇到陌生函数,查询用法,推荐!
Matplotlib是一个强大的Python视觉化库。几行代码就能绘製出散点图、折线图、直方图、柱状图、箱线图等。

第九週:业务理解和指标设计

到了第九週,大家可以发现,这个学习计划更多是偏业务的资料分析,可见业务理解的重要性。但业务理解需要多年的积累,没有掌握的捷径。刚入门也不会拷问太多业务上的问题,更多时候是考验你逻辑思维能力和资料分析的方法。所以简单花一周时间了解各行业的业态,各业务的通用指标。

其次,指标体系。几乎一个资料岗的岗位要求都会涉及这样一句话:「负责建立和优化部门的资料指标体系」。事实上目前大多的资料岗主要工作都是不断完善与优化资料指标体系,而对层面的工作是比较少的,即使岗位叫做资料分析师 。一个优秀的资料指标体系,不仅能让你快速解决资料需求,洞察出可能会被忽略的价值资料,还能反映出你目前最需解决的业务问题。所以,这一周还要掌握梳理业务指标的思路。

第十週:资料驱动&增长黑客

这个话题比较严肃,需要把资料分析师这个岗位放到整个公司甚至整个行业来看。任何一个岗位的设定都是要为企业带来价值或利润的,资料分析师也是如此。要搞清未来价值所在,升职加薪之路才会明朗。

目前有一个非常火的词来形容一类资料分析师,叫「增长黑客」,所做的事也很时髦,叫「资料驱动」。字面意思很好理解,就是利用资料分析技术给业务带来增长,驱动企业转型。

本周,你要了解业界不管是传统行业还是互联网行业资料驱动业务增长的成功案例。
未来成为增长黑客要做好哪些準备?
日常工作中,如何让自己避免成为「取数机」?
如何推动资料分析工作并得到老闆重视?
工作中有哪些工作细节,去潜移默化的改变身边人尤其是老闆对资料价值的认知?

最后,关于学习计划

本文系统的梳理了资料分析所要掌握的技能,帮助大家一步一步掌握基础资料分析的技能。
我是「数据分析那些事」。常年分享关于资料分析优质文章,不定期分享好用的职场技能工具。
各位也可以关注我的Facebook,期待你与我互动起来~


关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章