深度学习有哪些值得追踪的前沿研究?首先我们要知道什么是深度学习,深度学习与机器学习和人工智能的区别。深度学习从名字上也可以看出是更深层次的技术,那就先从人工智能入手,通俗点说,人工智能如同我们看的科幻电影黑客帝国中的人类同人工智能Matrix对抗的故事,亦或是现实世界中谷歌AlphaGo,第一个战胜围棋世界冠军的人工智能机器人。围棋作为最古老的一项运动被机器打败,标志着人工智能离我们越来越近。
- 人工智能(Artificial Intelligence,AI):就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序,这个定义是不是太抽象。换个说法,AI就是与人类行为相似的计算机程序,可以完成人们不认为机器能胜任的事。
图:人工智能应用场景
机器学习(Machine Learning,ML):一种实现人工智能的方法
机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据集来“训练”,通过各种算法从训练数据集中学习出一套判决准则,当有新的数据出现时它就可以利用训练好的模型去完成任务。
举个简单的例子,但我们手机上购物时,我们买了什么东西,或者经常浏览那些商品,在那些商品上浏览的时间长,那么后台的机器学习算法就会记录并分析你这些喜好的数据,然后推荐给你商品。
深度学习(Deep Learning,DL):一种实现机器学习的技术
深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此“深度模型”是手段,“特征学习”是目的。区别于传统的浅层学习,深度学习的不同在于:
强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;
明确突出了特征学习的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。
图:含多个隐层的深度学习模型
三者的区别和联系:机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法可视化地展现出它们三者的关系。
下面我们分析深度学习值得追踪的领域。
计算机视觉领域(Computer Vision,CV)
深度学习之所以能在 CV 领域火起来,除了减少了特征提取的麻烦外,还有其他的优势。比如它是端到端模型;训练中的特征提取器,甚至于训练出的模型都可以用于其他任务;它可以获得相较于传统方法更好的效果;同时它还是由极其简单的组件组成的。
尽管深度学习有很多优势,也取得了不小的成绩,也具有局限性,Gary Marcus 曾经说过,深度学习是贪婪,脆弱,不透明和浅薄的。
这些系统很贪婪,因为它们需要大量的训练数据;
它们是脆弱的,因为当神经网络应用在一些不熟悉的场景时,面对与训练中使用的示例不同的场景,它并不能很好的完成任务;
它们是不透明的,因为与传统的可调试代码不同,神经网络的参数只能根据它们在数学中的权重来解释,因此,它们是黑盒子,其输出很难解释;
它们是浅薄的,因为它们的训练缺乏先天知识,对世界没有常识。可以想象,一辆自动驾驶汽车可以行驶数百万英里,但它最终会遇到一些没有经验的新事物;一个机器人可以学会拿起一个瓶子,但如果让他拿起一个杯子,它就得从头学起。
仔细观察上述缺点的话,不难发现深度学习目前能解决的就是数据的问题,而至于其「智能」的问题,可能需要一个新的框架来实现了。当下深度学习有自己的优势,也有一定的局限性,而深度学习专家们也在尽力解决这些局限性。对于深度学习的未来,我相信除了它自己的改进外,还会在计算机视觉领域有较大的发展。
自然语言处理(Natural Language Processing,NLP)领域
提高NLP大家可能觉得有点陌生,其实有很多应用场景就在我们身边。比如搜索引擎、文本主题/标签分类、文本创作与生成、机器翻译、情感分析、语音识别系统、对话机器人。有个网站输入关键词就可在线生成一篇文章NLP的文本创作与生成。属于人工智能的一个子领域,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。它对计算机和人类的交互方式有许多重要的影响。目前该方面还有很多课题值得研究。
医学信息处理领域
传统的医学上看病都是病人去抽血体检化验等,然后回去等通知。医院拿到这些样本去化验分析,数据出来之后在交由医生进行诊断分析。这大大浪费了病人的治疗时间,近年来,深度学习在医学领域有较多的应用。今年疫情的原因,武汉封城,全国各地医生飞去志愿。急需各种医疗物资,而且对于肺炎的诊断需要各种医疗器械,通常都是机器拍片,医生来人眼去看病诊断,其实这也可以利用深度学习技术,来利用计算机实现医学信息处理,进而给出片子的诊断信息和建议。未来人们在医学领域的重视,必定离不开深度学习技术的发展。
5G通信领域
随着5G通信技术的商用,基于5G通信的应用场景越来越多。最近几年,有学者开始研究深度学习技术在通信领域的应用。如信号检测与估计,信道分配,波束赋形,基站天线的动态切换与分配等。无线通信中的信号检测与估计主要研究内容为凸优化、贝叶斯估计、统计信号处理、压缩感知等。这与深度学习中的贝叶斯理论相似,因此可以结合深度学习与通信领域进行研究,为5G通信技术的应用落地提供更多理论支撑。
自动驾驶领域
自动驾驶其实包含了众多技术的集成,最重要的还是通信技术和基于机器学习的计算机视觉。自动驾驶技术的关键技术可以分为:环境感知,行为决策,路径规划和行为控制。智能驾驶系统基于环境感知技术对车辆周围环境进行感知,并根据感知所获得的信息,通过车载中心电脑自主地控制车辆的转向和速度,使车辆能够安全、可靠地行驶,并到达预定目的地。无人驾驶是汽车智能化追求的终极目标,是信息通信等先进技术在汽车上的深度应用,体现了更便捷、更简单的人车交互方式,是对人的更大程度的「解放」。智能驾驶的整个流程归结起来有三个部分:
首先,是通过雷达、像机、车载网联系统等对外界的环境进行感知识别;
- 然后,在传感感知融合信息基础上,通过智能算法学习外界场景信息,规划车辆运行轨迹,实现车辆拟人化控制融入交通流中;
- 其次,跟踪决策规划的轨迹目标,控制车辆的油门、刹车和转向等驾驶动作,调节车辆行驶速度、位置和方向等状态,以保证汽车的安全性、操纵性和稳定性。
下图基本包含了自动驾驶研究所需要的各种硬件。