1
#一、数据挖掘的定义
|什么是数据挖掘?
- 数据挖掘是一个用数据发现问题、解决问题的学科。
- 通常通过对数据的探索、处理、分析或建模实现。
|数据挖掘学习路线
- 大学里并没有数据挖掘这么一个专业,现有的数据挖掘工程师大都来自工科或统计学等专业。
- 目前的数据挖掘工程师大都来自不同背景,计算机科学、数学甚至是机械工程。要想成功胜任,其诀窍是热情、好奇心,不断学习新的工具的能力,以及对数据清洗和分析的耐心。
|给新人的建议
- 最重要的三个品质:好奇心、是非观以及批判性思考。这三个品质,放在其他领域同样适用。
- 专业领域的三种能力:编程能力、统计基础、商业思维。编程和统计在大学较为容易学到,商业思维需要多实践总结。
#二、数据挖掘在做什么
2
数据挖掘是指这个过程:
在庞大数据集当中发现模式,将它转换成有效的信息。该技术利用特定的算法、统计分析、人工智能和数据库系统,从庞大数据集中提取信息,并转换成易于理解的形式。
数据挖掘定义有广义和狭义之分:
3
就是大数据时代,将收集到的大量基础数据,进行分析,找出其中规律,使基础数据产生价值。这算是一种统计学。目前数据挖掘作用不明显,主要是企业拿来筛选精准客户。了解客户需求。因为数据量还太小了,未来5G时代,将会产生比现在几何倍增长的大数据,那时基础数据够大,数据挖掘的价值才会展现出来。
对于数据挖掘的态度,就是乐见其发展,但同时保护用户隐私。不然扎克伯格现在遇到的隐私泄露问题,会不断重复上演。