小肥柴的Hadoop之旅

小肥柴的Hadoop之旅(目录)(第0章)

  • 导航
    • [0-0-1 写博客的初衷](#0-0-1 写博客的初衷)
    • [0-0-2 参考资料和书籍](#0-0-2 参考资料和书籍)
    • [0-0-3 完工部分传送门](#0-0-3 完工部分传送门)

导航

0-0-1 写博客的初衷

从门外汉边学边上课,到入门的菜鸡,对如何正确的学习Hadoop有了一点点自己的理解和感想,遂做成一个教程方便同学们在线学习(努力避免误人子弟),同时与网友们分享交流。

个人的一点建议:

(1)Hadoop等大数据类课程,教程有很多,教材也不少,但我总觉得很多时候学院派讲原理不是很到位:毕竟这是一个基于开源项目起家的课程,天然具有工程实践性;如果不去解析源码、架构、算法和了解技术的演进,纯纯堆砌术语和概念的学习/授课是没有意义的。

(2)学习Hadoop要有较为扎实的Java语言、数据结构与算法、计算机网络、软件工程(特别是各种设计模式)和操作系统基础知识,能做到心中有概念,现学现用即可。

(3)学习过程要秉承"what-why-how"的学习思路,对技术点、术语和概念要多问几个为什么,并在工程源码和问题推演中寻找符合逻辑推理的正确答案,不能人云亦云。

(4)多看源码、多思考、多验证、多练习;积极拥抱部分培训班的高质量教学视频,多读几遍参考资料,比傻乎乎地跟着学校的Hadoop课程学,你会收获更多。

0-0-2 参考资料和书籍

(1)《Hadoop权威指南》

(2)Hadoop官网

(3) 马士兵版Hadoop教程(理论相当透彻)

(4) 尚硅谷版Hadoop教程(案例多,理论不如(2))

(5)其他的网络博客、教程

【声明】我的博客内容是参考了《Hadoop权威指南》和《马士兵版Hadoop》教程的内容,根据个人的理解分享的知识,如有侵权,请及时联系本人。

0-0-3 完工部分传送门

第1章 Hadoop大数据技术概述 1.1 理解大数据(1)
第1章 Hadoop大数据技术概述 1.1 理解大数据(2)

相关推荐
字节跳动数据平台9 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术10 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康12 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
初次攀爬者4 天前
ZooKeeper 实现分布式锁的两种方式
分布式·后端·zookeeper
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全