大数据是我的研究方向之一,目前我也在做大数据方面的项目,所以我来一下这个问题。
大数据从概念的提出到现在产业链的初步形成已经走过了一段时间,目前针对于大数据的工作岗位主要集中在大数据平台搭建、程序员、算法设计、算法实现、数据分析、数据采集整理、测试以及安全等岗位。
大数据平台搭建、功能程序员、算法实现工程师都需要掌握编程知识和大数据平台的搭建以及功能部署知识。目前大数据平台多以Hadoop和Spark为基础,不少商业大数据平台也是构建在Hadoop和Spark之上的,所以要掌握这两个平台的搭建、部署,可以先选择Hadoop和Spark的书籍。
大数据平台下的程序设计以使用Python、Scala、R和Java居多,Spark平台以Scala居多,Hadoop平台以Python和Java居多,所以要根据不同的平台选择对应的语言,我比较推荐学习Python语言。可以购买关于Python编程的学习书籍,尤其是与大数据学习相关的,比如基于Python的数据分析,基于Python的机器学习等书籍。
如果做算法设计还需要学习大数据常见的算法,比如决策树、朴素贝叶斯、k近邻、回归等等,我带的团队要求算法设计人员同时做算法实现,但是也有的团队是分开的。所以可以选择一些对应的算法分析书籍,比如算法导论等等。
学习编程语言需要看哪些书籍?学习大数据需要看哪些书籍?
我认为题主的问题可能是这两个,首先对于学习编程语言需要看哪些书籍做一个,因为本人是非科班+低学历自学的软件开发,平时也积累了一些学习经验以及翻阅过某些书籍,希望能帮到题主。
因为不知道题主有没有学习编程语言的经历,或者说有对哪个编程语言感兴趣,这里就列举几个热门的编程语言吧。
1.Java
作为一个老牌的编程语言,已经发展了将近20年,其背后的生态已经十分强大与成熟。
大数据学习路线及各阶段学习书籍推荐!废话不多说,直接切入主题,有需要的小伙伴可以参考学习!
阶段一、大数据基础——java语言基础方面
(1)Java语言基础
Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类
(2) HTML、CSS与JavaScript