1
感请!
如果只是应用Hadoop/Spark进行数据分析,那么JavaSE只需要基本了解就行了,重点在于深入理解Hadoop/Spark各自的计算模型和实现原理,以及常见的数据分析方法和分布式算法。实际的分析工作,甚至可以不使用java,使用各自的streaming接口用任意语言编写。另外,Spark与Hadoop不同,原生语言是Scala。
看自己个人技术的掌握程度了。
2
据我自己的编程经验来说,如果用Java做大数据的话,无非Hadoop和Spark这两块了。
Hadoop
Hadoop无非是MapReduce那套,用到Java中的spring,springmvc是前端相关的库,mybatis是一个数据库操作库,如果走算法这条路,精通Hadoop的相关api,以及怎么和hive,habse交互,比再开辟一条前端技术栈,折腾spring要划得来.
3
想学习大数据隐私保护,选择Java作为编程语言的话,建议你不要自学。因为需要学的东西比较多而且复杂有深度,建议你找一家靠谱的培训机构去系统的学习。因为我是计算机专业毕业的,身边很多的同学都是这样走过来的。