人工神经网络中,一个神经元是一个半线性的数学模型,所有的输入和权重一起线性叠加,最后非线性地映射到0和1之间。由大量神经元组成的神经网络,是一个复杂的非线性模型。人工智能的学习过程,从数学上看,本质上是一个优化问题:调整这个模型里的大量参数,使得它能够符合大量已知数据的结果。如果能得到和已有经验的好的符合,就学习好了。这个模型就可以用来解决实际问题了。
数学的角度看,网络模型本质上是函数的表示模型,学习的过程就是通过数据匹配实现函数建模的过程,实现数据的逼近或拟合。网络模型的结构和规模决定模型的表示能力,表示能力越强,建模需要的数据规模也越大,或者学习利用数据能力越强,同时学习需要的计算资源也会越多。显然,深度学习实现的网络模型就是可以利用大数据实现丰富表示能力的函数建模。