Java技术栈 —— Hadoop入门(二)

Java技术栈 ------ Hadoop入门(二)

  • 一、用MapReduce对统计单词个数
    • [1.1 项目流程](#1.1 项目流程)
    • [1.2 可能遇到的问题](#1.2 可能遇到的问题)
    • [1.3 代码勘误](#1.3 代码勘误)
    • [1.4 总结](#1.4 总结)

一、用MapReduce对统计单词个数

1.1 项目流程

(1) 上传jar包。

(2) 上传words.txt文件。

(3) 用hadoop执行jar包的代码,对words.txt进行分析。

参考文章或视频链接
重点看这篇文章 1 《Hadoop实战------MapReduce对英文单词文本进行统计和排序(超详细教学,算法分析)》- CSDN
2 Hadoop实战项目源码集合 - gitee
3 HDFS文件系统的根目录和用户主目录解析 - CSDN

1.2 可能遇到的问题

(1) 无法Download结果文件。 这个问题看参考文章1-3,有两个点要注意,注意你的hosts文件有没有配对,以及有没有开启dfs.webhdfs.enabled

(2) 删除不了hadoop下的文件夹。 这个问题的解决方案看本节参考文章4,不过我要提醒你的是,他那篇文章里的summer对应与你当前的Linux用户,我这里就叫programmer,然后重启hadoop,dr.who是谁可以看参考文章5

(3) 更改用户后还是无法删除文件夹。 解决方案看本节参考文章6,先关闭安全模式再删除。

shell 复制代码
# 进入安全模式
hdfs dfsadmin -safemode enter
# 退出安全模式
hdfs dfsadmin -safemode leave
1.2 参考文章或视频链接
1 Unable to open/download files in HDFS using Hadoop Web UI - stackoverflow
2 记一次HDFS Web报错Couldn't preview the file. NetworkError: Failed to execute 'send' on 'XMLHttpRequest' - CSDN
3 HDFS Web报错Couldn't preview the file. - CSDN
4 《Hadoop常见错误及解决方案、Permission denied: user=dr.who, access=WRITE, inode="/":summer:supergroup:drwxr-xr-x》
5 《Permission denied. user=dr.who is not the owner of inode=/tmp》
6 《Name node is in safe mode》

1.3 代码勘误

本章节代码作者有个地方写错了,注意下即可。

java 复制代码
//WordReduce.java文件里应该这样写
System.out.println(new Date().toGMTString() + ":" + key + "出现了" + sum);

1.4 总结

MapReduce也没那么神神秘秘(世界上没有事物是不可认识的,只有还有待认识的事物),总结起来就还是四个字,分工+协作 ,或者可以理解为民主集中制 的基本原则之一:"个别酝酿,集体决定"
Map是拆分开来,各自计算各自思考,而Reduce就是将结果集中起来,看看大家提出的意见到底如何,并对结果按照具体需求进行排序。在MapReduce这个思想上,共产党人走在这帮搞技术的老外的前面。

相关推荐
在繁华处5 分钟前
Java从零到熟练(九):并发编程基础
java·开发语言
木头程序员10 分钟前
SSM框架学习笔记
java·开发语言·mysql·spring·maven
李白你好13 分钟前
页面资产梳理 · 技术指纹识别 · Spring 端点探测
java·后端·spring
一起逃去看海吧15 分钟前
dify-03
java·linux·开发语言
我是一颗柠檬22 分钟前
【Java后端技术亮点】热Key探测与本地缓存二级防护:Redis热点问题的终极解决方案
java·redis·后端·缓存·中间件
Refrain_zc1 小时前
Android 音视频通话核心 —— 音频编码(AAC)完整解析
java
xiaoshuaishuai81 小时前
C# AvaloniaUI 资源找不到报错
java·服务器·前端·windows·c#
Xin_ye100861 小时前
C# 零基础到精通教程 - 第十八章:部署与发布——让应用上线
开发语言·c#
我是唐青枫2 小时前
Java JdbcTemplate 实战指南:用 Spring 轻量完成数据库增删改查
java·数据库·spring
思麟呀2 小时前
C++11并发编程:call_once一次性执行+atomic原子类型+CAS无锁编程+自旋锁
linux·开发语言·jvm·c++·windows