有Java经验想转大数据还需要学习多久呢?有没有好的建议呢?

1

作为一名大数据方向的研究生导师,我来一下这个问题。

从大数据的技术体系来看,主要涉及到三大方面的内容,其一是大数据平台;其二是大数据开发;其三是大数据分析,对于具有Java编程基础的人来说,学习大数据会相对容易一些,但是依然需要一个系统的学习过程,具体需要多长的学习时间取决于自身的学习计划、学习环境等因素。

大数据的技术体系目前已经趋于成熟,而且大数据涉及到的知识量也比较庞大,所以应该找一个切入点并制定一个适合自己的学习计划,学习计划的制定可以按照就业岗位的要求为参考。如果具备Java基础,且同时有较为扎实的数学基础,可以考虑从事大数据开发岗位和大数据分析岗位(算法岗),目前大数据研发岗位和算法岗位往往对于学历有一定的要求(应聘时),这一点应该引起注意。从2019年的研究生秋招情况来看,目前大数据开发岗位的数量比较多,算法岗位的数量还是比较少的。

对于大数据的初学者来说,从大数据应用开发开始学起是不错的选择,具体可以按照三个步骤来学习,首先是学习大数据平台知识,掌握大数据平台的搭建以及各个组件之间的关系和作用,这个过程需要4周左右的时间,建议从开源大数据平台(Hadoop、Spark)开始学起,这样会掌握更多的细节。

其次是在大数据平台下进行大数据应用开发,这个过程会掌握一些常用的API,此时应该完成大量的实验,通过实验来积累一定的大数据开发经验。在组织实验的过程中要考虑逐渐递进的过程,要有一个清晰的实验体系,此时不必追求大而全。具有Java基础的前提下,这部分大概需要8至10周左右的时间。

2

这个要看自己的学习进度和自制力,个人建议参加一个培训机构,系统的学习一下,如果自制力好的话,两三个月就可以。

3

其实语言和大数据没有直接的关系。在我看来,想进入大数据领域,语言只是工具,数据库、算法、数学、统计学以及所在行业的专业知识才是功底。至于时间,不好说,我是用了半年(开发从业二十年了,各种数据库很溜,开发语言会好几种,垮平台什么的更不用说,而且因为学习精算师的缘故已经把基础课都学完了,包括高数,统计学等)。

建议楼主从java领域的开源大数据项目开始介入,逐步了解hadoop,适当的学习一下python,了解redis、HDFS,学习使用SparkHive、SparkSQL,同时建议读一下Data X或者Kettle,然后开始学习一些机器学习的算法和开源库如Tensorflow之类的,开发平台的选择看你自己的需求。

当以上内容基本融会贯通了,你就可以开始进入大数据领域了,首先要去采集一些有价值的样本数据,在逐步学习深入的过程中学习机器建模,以及统计学原理,数论,统计方法等传统统计学的课程,统计建模是重点一定要下功夫,线代微积分离散数学都是基础,你也需要重新拾起来。

当这些都学的差不多了,你就具备了采集数据分析数据的基本能力了,那样就可以深入的再学习一下统计学的一些深层次课程和传统BI的一些课程了。

当你具备了这些能力,你就具备了一个合格的大数据分析师的水平了!

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章