优秀的数据分析师并不能速成,但是零经验也有零经验的捷径。
市面上有《七周七数据库》,《七周七编程语言》。今天我们就《七周七学习成为数据分析师》,没错,七周。
第一周:Excel学习掌握
如果Excel玩的顺溜,可以略过这一周。但很多人并不会vlookup,所以有必要讲下。
了解sum,count,sumif,countif,find,if,left/right,时间转换等。excel的各类函数很多,完全不需要学全。重要的是学会搜索。我学函数是即用即查,将遇到的问题在网上搜索得到所需函数。
以下推荐一些从入门到精通——关于学习数据分析的书籍清单!
入门篇
《深入浅出数据分析》:大头书,HeadFirst系列,内容很浅,比较适合没有基础的人作为科普读物,适合快速入门;
《统计数字会撒谎》:本文不涉及枯燥的数学公式与推理过程,通俗易懂,其实讲的都是统计学最基本的常识,可是却往往容易被人所忽视;
《谁说菜鸟不会数据分析》:不错的工具类书籍。比较浅显,适合完全没有Excel或对Excel似懂非懂的人。 讲了一些方法论的东西,但是非常的简单,不太适合对Excel熟悉的读者;
作为一个奋战在一线的数据分析岗,我觉得应该有些话语权。
首先,需要定位清楚,学习是一个量变的过程,但是,我想分享的是如何快速且高效的掌握到技能然后找到自己想要的工作。前面分享的各位大佬都把数据分析中用的工具给列了出来。
然而,我这里分享的就是数据分析岗需要解决什么任务,为了解决什么任务用什么样的数据分析工具去分析。在这个分析的过程中,把工具使用透。而不是先把工具学会,再去分析,本末或许会被倒置。
互联网电商常见命题:
订单量增长原因,差评增加原因,访问pvuv增长。
一、为什么学习数据分析
1、运营的尴尬:运营人需要一个硬技能
每个初入行的新人都会察觉到,运营是一个似乎并没有自己的核心竞争力和安全感的工作。因为每天的工作好像都被各种琐事所围绕,而只有一个主题是永恒不变的,那就是---提需求,不断的提各种需求。
运营人需要一个硬核技能,提升自己的职业价值,提高自己的职业安全感,而不是每天都在各种的等排期:数据分析排期、产品设计排期、UI排期、开发排期。
运营迫切需要通过利用SQL/Python等工具,从数据中及时发现更多的业务价值,提高自己的产出。
这是一份数据分析师的入门指南,它包含七周的内容,Excel、数据可视化、数据分析思维、数据库、统计学、业务、以及Python。
每一周的内容,都有两到三篇文章细致讲解,帮助新人们快速掌握。这七周的内容刚好涵盖了一位数据分析师需要掌握的基础体系,也是一位新人从零迈入数据大门的知识手册。
第一周:Excel
每一位数据分析师都脱离不开Excel。
它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。
不管是运营APP,还是运营微信公众号,头号号,大鱼号,还是百家号,新媒体数据不仅是数据工程师和分析师的事情,在工作中也要求运营从业者有一定的数据分析能力。
新媒体数据分析
公子义认为数据是优化新媒体运营关键所在,能更好推动运营策略和工作的开展。
数据分析分为两部分,数据和分析。
数据通过Excel和PPT即可展示,可以在一些专业的数据平台获得数据,比如艾媒北极星、百度指数、微指数、微信指数等等。
而分析才是大学问。对于数据的引用,分析的方法,推荐你可以参考一些部门、协会和机构的高质量数据报告,比如麦肯锡,尼尔森,思略特,艾媒咨询,多参考专业的报告进行练习。
怎么入门数据分析?
1、打好概率与统计的基础
概率与统计是数据分析的基石,像一些概率分布、抽样、线性回归、时间序列都是数据分析当中经常会用到的,可以说日常碰到的大部分的分析需求都可以用统计分析来解决。
2、掌握数据库技能
做数据分析离不开查询数据库,这里主要涉及的是SQL。对于传统的数据库如MySQL,SQL Server,Oracle,或者大数据平台Hadoop,都可以通过SQL查询的方式来获取数据。
- 数学基础(数据分析的原理)
- 编程基础(数据分析的实现手段)
- 这两个基础建议先了解一下基本的数学原理;
- 然后根据你需要,选择一款相关数据分析软件(Excel、SPSS、Matlab、R、Python),做些针对性的练习;
- 后面在不断的实际应用中学习成长就好。
摘自今日头条号《算法集市》— 数据分析的数学基础简介
1、描述性数据汇总
描述性数据汇总可以识别数据的典型性质,包括数据的中心趋势和离中趋势。
讲理论的多,我来一些实际经历
数据分析如何开始?
我最早做数据分析是从网站统计开始的,从CNZZ到Google Analytics都有用过。我们能够这些地方知道什么呢?网站流量,用户情况,行为统计等等。以GoogleAnalytics为例,以下是我一个网站的流量图:
从这个图里面,我们可以看出什么呢?用户数有多少,每个用户访问几个网页,每个用户停留多长时间,跳出率有多高等等。