1
大数据的挖掘常用的方法有分类、回归分析、聚类、关联规则、神经网络方法、Web 数据挖掘等。这些方法从不同的角度对数据进行挖掘。
所以总体可以认为深度学习跟机器学习都属于数据挖掘的方法。
(1)分类
分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类。
比如我们在电商商平台上的各类产品,肯定要按照产品属性进行分类,对应的数据挖掘的分类,就是利用属性去寻找有共同特点的数据对象,归到一个大集合。
2
数据挖掘,机器学习与深度学习其实都是属于人工智能下的机器学习范畴。机器学习算法按功能主要分为有监督学习算法、无监督学习(也叫聚类)算法、半监督算法和强化学习算法。顾名思义,有监督学习算法就是在训练模型的时候,每条样本都有明确的类标;无监督学习算法在训练的时候完全没有类标;半监督学习算法就是有一部分存在类标,另一部分样本没有类标;强化学习就是在训练的过程中,通过现实环境反馈机制对模型进行矫正的方式来达到训练的目的。而训练好的模型,遇到未知样本的时候,我们就可以对其结果进行预测,也就是题中所说的决策。关联其实是一类算法,比如说推荐算法中的关联分析
3
①朴素贝叶斯:
原理è 朴素贝叶斯分类器基于一个简单的假定:给定目标值时属性之间相互条件独立。
条件概率:在B已经发生的情况下继续发生A的概率表示为,同样的,综合可得即贝叶斯定理;文字表述为:
P(类别|特征)=(P(特征|类别)*P(类别))/P(特征)
过程è 在劳动能力鉴定系统的使用中,(1)根据政府发布的伤残等级评定标准构建病例词典;(2)首先对病例进行分词,提取关键词的词频向量和数值大小,使用贝叶斯算法判定待鉴定人员的残疾级别;