Hadoop安装

草稿

install

https://help.aliyun.com/zh/ecs/user-guide/build-a-hadoop-environment

vim /opt/hadoop/etc/hadoop/core-site.xml

xml 复制代码
<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/opt/hadoop/tmp</value>
        <description>location to store temporary files</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

vim /opt/hadoop/etc/hadoop/hdfs-site.xml

xml 复制代码
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/data</value>
    </property>

如果不手动指定,Hadoop 默认会将临时数据放在 /tmp/hadoop-${user.name} 目录下


创建用户组和用户

shell 复制代码
groupadd test
useradd -m -g test test

# 这种方法允许该用户在本地运行进程,但切断了远程访问(推荐)
echo DenyUsers test >> /etc/ssh/sshd_config
# 设置密码
passwd test
visudo
test  ALL=(ALL)       NOPASSWD:ALL
chown -R test:test /opt/hadoop/

Hadoop 的启动脚本是通过 SSH 登录到各个节点(即便只有 localhost 一个节点)来启动服务的

复制代码
ssh-keygen
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
  • 环境变量的隔离: 当执行 start-dfs.sh 时,它会启动多个 SSH 会话。这些会话通常是 Non-interactive Shell ,它们不会加载 /etc/profile~/.bashrc
  • Hadoop 的自救机制: hadoop-env.sh 是 Hadoop 运行环境的"宪法"。只要在这里定义了,无论通过什么方式启动,Hadoop 都能准确找到 Java。
shell 复制代码
$  vim /opt/hadoop/etc/hadoop/hadoop-env.sh
export JAVA_HOME=/opt/java/jdk-11.0.30
export HADOOP_HOME=/opt/hadoop

export HDFS_NAMENODE_OPTS="-Xms256m -Xmx512m"
export HDFS_DATANODE_OPTS="-Xms256m -Xmx512m"
export HDFS_SECONDARYNAMENODE_OPTS="-Xms256m -Xmx512m"

hive 和 Hadoop 的版本保持一致,都使用JDK8,并且都使用非root用户

相关推荐
Are_You_Okkk_6 分钟前
基于MonkeyCode解析AI研发新模式,根治开发低效痛点
大数据·人工智能·开源·ai编程
科技AI训练师1 小时前
2026高压清洗泵厂家选择指南:判断标准与选购要点
大数据·人工智能
Percent_bigdata1 小时前
“模数共振”开启产业AI新阶段,重新定义数据治理
大数据·人工智能
狒狒热知识3 小时前
2026年AI传播新闻软文营销发布当下178软文网领衔发展路径
大数据·人工智能
phltxy3 小时前
RabbitMQ集群搭——多机多节点与单机多节点
分布式·rabbitmq·ruby
出海小龙3 小时前
B2B 跟 B2C 的联盟营销有何根本区别?以及分别如何真正推动增长?
大数据·人工智能
QiLinkOS3 小时前
【从实验室到商业战场:发明专利如何重塑科技与企业的共生生态】
大数据·c语言·数据结构·c++·人工智能·单片机·算法
不做无法实现的梦~4 小时前
git指令速查
大数据·elasticsearch·搜索引擎
汤姆yu4 小时前
SkyClaw‑v1.0昆仑万维天工 AI
大数据·人工智能