数据分析工具其实有很多种,对应不同类型的使用者也有各自适合的选择。例如懂数据算法计算机语言的人,可能给他一款,填写算法代码流畅的分析软件就是有效。掌握了数据分析专业技能的人,强大的分析功能能将工作做到事半功倍,不管看着功能多复杂。还有就是我这种非计算机专业出身,非统计学出身,但工作做还需要对大量数据进行分析的人。
如果你跟我一样,那么可以看下我的。
我总结了下,我以前找分析工具的时候,自己先想了几个方向点:
SPSS、SAS都是用于统计分析,围绕统计学知识的一些基本应用,包括描述统计,方差分析,因子分析,主成分分析,基本的回归,分布的检验等等。SPSS用于市场研究较多,SAS银行金融和医学统计较多,有一些难度。
R语言像是综合性较强的一类数据分析工具,集统计分析、数据挖掘,数据可视化。展开来,讲讲数据分析~这些数据分析工具的使用还是看需求,每个企业应用的选择和方式都不同。
数据分析的概念很广,站在IT的角度,实际应用中可以把数据分析工具分成两个维度:第一维度:数据存储层——数据报表层——数据分析层——数据展现层
第二维度:用户级——部门级——企业级——BI级
1、数据存储层
感请@冯东升3
数据分析,顾名思义,指的是用适当的统计分析方法对收集来的数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。小到一个简单的折线图,大到大数据分析,其包括范围非常广泛。
下面从中挑选四种具有代表性地来讲一讲:
自带数据源的大数据分析工具——百度指数:
这类工具以海量网络数据为数据源,并对这些数据进行分析。
代表工具:百度指数、微信指数、5118、爱奇艺指数等。
说到数据分析,其实很多人都用过excel做过简单的数据分析,也都知道用excel来做数据分析还是有一定缺陷,一是分析类型不够丰富,二是数据量过多时excel不给力,三是图表的制作比较复杂。
那有没有更专业的可视化工具呢?
目前国内数据可视化工具或产品很多,到底那个工具或者产品是最好的?看了很多数据可视化产品,总结下来分为几大类。
- 数据可视化库类
- 报表、BI类
- 大屏投放类
- 专业类(地图、科学计算、机器学习)
下面我将一一分别进行工具介绍:
一.数据可视化库类- Echarts
一个纯javascript的数据可视化库,百度的产品,常应用于软件产品开发或者 系统的图表模块,图表种类多,动态可视化效果,开源免费。
评价:非常好的一个可视化库,图表种类多,可选的主题。Echarts中主要还是以图表为主,没有提供文本和表格方面的展现库,如果有相关需求还需要引入表格和文本方面的其他可视化库。
- HighCharts
与echarts相似,同样是可视化库,不过是国外的产品,商用需要付费,文档详尽。
很多企业都开始数据治理,并探索不同工具和方法来实现。然而,企业往往又会被不同的数据分析工具所困惑。
那么,企业应该如何选择数据分析工具呢?主要考虑以下6个重要方面:
01分析蓝图
无论是从哪一类具体的分析需求开始,对于分析的构建,都需要设想整个蓝图。
对于数据分析新手来说,最核心的是业务,通过业务的分析逻辑影射到数据分析的处理逻辑,而数据分析工具则是帮助我们实现结果的手段。
但是,你说工具不重要吧,他又很重要,对应数据分析的不同环节,也要选择不同的工具,甚至选择更容易上手,下面我就推荐四个适合新手入门的数据分析工具:
一、Excel适用场景:
- 一般的办公需求下的数据处理工作;
- 中小公司数据管理,存储(很多国有企业都用);
- 学校学生,老师做简单的统计分析(如方差分析,回归分析);
- 结合Word,PowerPoint制作数据分析报告;
- 数据分析师的主力分析工具(部分数据分析师的辅助工具);
- 部分商业杂志,报刊图表制作(数据可视化);
优点:
- 容易上手;
- 学习资源十分丰富;
- 可以用Excel做很多事情,建模,可视化,报表,动态图表;
- 帮助你在进一步学习其它工具之前(比如Python,R),理解很多操作的含义;
缺点:
东软平台云(https://cloud.neusoft.com/)的DataViz就可以,DataViz支持多种数据源,而且简单易用,业务人员通过拖拽就可以创建丰富的图表进行数据分析。还支持图表联动、大屏展示等。
另外还支持动态传统图表和高级可视化图表,多种科技、商务主题自由切换。
发一些我用过或见过的工具:
1、excel:这个不用多说了,既能够存储数据,又可以做分析图表,如果会vba还可以发挥更大功力。想对excel有深入理解的话可以关注一下Jorge Camoes(excel大神)。他的作品浑身都在咆哮“谁说excel不好看来着???”
2、tableau:这个是不是也不用多说?第一个改写商业智能笨重难学的工具。通过鼠标拖拽,在较短的时间内就能跟数据说上话。商业智能界的概念王,金句制造者,鸡血池。看它家官网经常会热血沸腾。最近改版了,一个大横播是这样的:
数据分析工具针对不同的受众;数据量的大小;分析的目的;数据的形式及复杂性的不同而不同。
但是这改变不了数据分析的基础质量条件,处理流程,数据可视化,运用的数理知识等。只是对于现在目前的市场上的各种的分析工具可能只是侧重于其中的一点或几点,从狭隘的方面来说,大众对于数据分析工具是在最终呈现的数据图表或汇总数据。所以现在依据前面提到的几个方面进行说明:
对于要分析数据,首先需要数据存储的载体
1 数据量不太大,请没有信息化系统情况下,Excel是明智的选择;使用人群多,且有较多的学习资料。
2 较大的数据量结婚信息化应用系统,对应的也就是各类的关系型数据库,结合使用SQL,达到即席查询