目前工作中,在处理数据中最让人头痛的一个问题是:合并单元格的乱用
这让后续做数据分析的人很头痛,举一个简单的例子,大家可以看一下
下表是某公司的销售业绩表
现在我们想汇总一个每个员工的销量,我们使用数据透视表进行汇总,插入一个数据透视表,将英雄放在行标签,将销量放在值,求出的结果如下
对于求出的结果,我们看到,程咬金的销量只有100,但实际表格中远不止100,因为合并了单元格,所以用数据透视表汇总的时候,只会统计第一个值。
为了得到正确的结果,我们需要先将合并的单元格进行拆分
这个问题我还是很有经验。本人就是从事数据分析工作,目前在阿里云做相关的数据处理项目,平时接触的数据分析工具最基础的还是Excel。做数据分析,很多工作就是用在对原始数据的处理的工作上,所以用excel很多时候考验的是你对Excel的熟练程度,因为重复性工作太多,如果可以用VBA解决就可以节约很多时间。还有一点当数据量大一点的时候就会很卡,一般都是在10万的数据处理时用Excel会比较房间。一旦超过了还是在数据库里先进行预处理,筛选减少不必要的数据,当然有懂Python的话,这门语言是做数据分析最佳的工具,语句简单,完成的效率绝对比Excel快,而且可视化展现会比Excel来得更灵活。