news 2026/3/12 20:59:24

任务一- 2.子任务二:Hadoop完全分布式安装配置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
任务一- 2.子任务二:Hadoop完全分布式安装配置

2.子任务二:Hadoop完全分布式安装配置(任务一)

在 主 节 点 将 Hadoop 安 装 包 解 压 到/root/software目录下
tarzxvf hadoop-3.2.1.tar.gz -C /root/software/
依次配置hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml和workers配置文件

在修改配置文件之前先进入path/to/hadoop/etc/hadoop目录:
所有的配置文件都在path/to/hadoop/etc/hadoop下面,如下图:

(1)hadoop-env.sh配置文件

在文件里面输入hadoop的路径

exportJAVA_HOME=/root/software/jdk1.8exportHDFS_NAMENODE_USER=rootexportHDFS_DATANODE_USER=rootexportHDFS_SECONDARYNAMENODE_USER=rootexportYARN_RESOURCEMANAGER_USER=rootexportYARN_NODEMANAGER_USER=root
(2)core-site.xml配置文件
<!-- 在configuration标签内添加以下内容 --><property><name>fs.defaultFS</name><value>hdfs://master:9000</value></property><!-- 临时文件存放位置 --><property><name>hadoop.tmp.dir</name><value>/root/software/hadoop-3.2.1/hadoopDatas/tempDatas</value></property>
(3)hdfs-site.xml配置文件
<!-- 在configuration标签内添加以下内容 --><!-- 设置副本数量 --><property><name>dfs.replication</name><value>2</value></property><!-- namenode存放的位置,老版本是用dfs.name.dir --><property><name>dfs.namenode.name.dir</name><value>/root/software/hadoop-3.2.1/hadoopDatas/namenodeDatas</value></property><!-- datanode存放的位置,老版本是dfs.data.dir --><property><name>dfs.datanode.data.dir</name><value>/root/software/hadoop-3.2.1/hadoopDatas/datanodeDatas/</value></property><!-- 关闭文件上传权限检查 --><property><name>dfs.permissions.enalbed</name><value>false</value></property><!-- namenode运行在哪儿节点,默认是0.0.0.0:9870,在hadoop3.x中端口从原先的50070改为了9870 --><property><name>dfs.namenode.http-address</name><value>master:9870</value></property><!-- secondarynamenode运行在哪个节点,默认0.0.0.0:9868 --><property><name>dfs.namenode.secondary.http-address</name><value>master:9868</value></property>
(4)mapred-site.xml配置文件
<!-- 在configuration标签内添加以下内容 --><!-- 设置mapreduce在yarn平台上运行 --><property><name>mapreduce.framework.name</name><value>yarn</value></property><!-- 配了上面这个下面这个也得配, 不然跑mapreduce会找不到主类。MR应用程序的CLASSPATH--><property><name>mapreduce.application.classpath</name><value>/root/software/hadoop-3.2.1/share/hadoop/mapreduce/*:/root/software/hadoop-3.2.1/share/hadoop/mapreduce/lib/*</value></property><!-- 历史服务器端地址 --><property><name>mapreduce.jobhistory.address</name><value>master:10020</value></property><!-- 历史服务器web端地址 --><property><name>mapreduce.jobhistory.webapp.address</name><value>master:19888</value></property>
(5)yarn-site.xml配置文件
<!-- 在configuration标签内添加以下内容 --><!-- resourcemanager运行在哪个节点 --><property><name>yarn.resourcemanager.hostname</name><value>master</value></property><!-- nodemanager获取数据的方式 --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><!-- 关闭虚拟内存检查 --><property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value></property>
(5)workers文件

删掉里面的localhost,添加以下内容

master slave1 slave2
(3)在master节点的Hadoop安装目录:

下依次创建hadoopDatas/tempDatas 、 hadoopDatas/namenodeDatas 、hadoopDatas/datanodeDatas、hadoopDatas/dfs/nn/edits、hadoopDatas/dfs/snn/name 和hadoopDatas/dfs/nn/snn/edits目录
进入hadoop安装目录下执行下面命令:

mkdir-p hadoopDatas/tempDatasmkdir-p hadoopDatas/namenodeDatasmkdir-p hadoopDatas/datanodeDatasmkdir-p hadoopDatas/dfs/nn/editmkdir-p hadoopDatas/dfs/snn/namemkdir-p hadoopDatas/dfs/nn/snn/edits
(4)在master节点上使用scp命令将配置完的Hadoop安装目录直接拷贝至slave1和slave2
scp-r /root/software/hadooproot@slave1:/root/software/scp-r /root/software/hadoop root@slave2:/root/software/
(5)三台节点的“/etc/profile”文件中配置Hadoop环境变量HADOOP_HOME和PATH的值,并让配置文件立即生效;
vi/etc/profileexportHADOOP_HOME=/root/software/hadoop-3.2.1exportPATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbinsource/etc/profile

生效之后可以在每一个节点上查看hadoop的安装版本:

(6)在主节点格式化集群
hdfs namenode -format

(7)在主节点依次启动HDFS、YARN集群和历史服务
# 在master节点上进行start-all.sh mapred --daemon start historyserver(mr-jobhistory-daemon.sh start historyserver)

jps是查看进程的命令
在master节点上输入jps
在slave1节点上输入jps


在slave2节点上输入jps

补充说明——各组件 Web UI 访问方式(核心)

  1. HDFS Web UI(文件系统监控)
    默认端口:Hadoop 3.x 为9870(Hadoop 2.x 为50070,需注意版本差异);
    访问地址:http://主节点主机名/IP:9870(例:http://master:9870、http://192.168.1.100:9870);
    核心查看内容:
    左侧「Browse the file system」:查看 HDFS 文件目录;
    「Datanodes」:查看从节点 DataNode 是否正常在线;
    「Overview」:查看 HDFS 容量、已用空间等状态(验证 HDFS 集群正常)。
  2. YARN Web UI(资源调度监控)
    默认端口:8088(3.x/2.x 通用);
    访问地址:http://主节点主机名/IP:8088(例:http://master:8088);
    核心查看内容:
    「Cluster Overview」:查看集群总内存、CPU 核数、NodeManager 数量(验证 YARN 集群正常);
    「Applications」:查看已提交 / 运行 / 完成的 MapReduce/Spark 任务(大赛中提交 WordCount 后可在此验证任务状态);
    「Nodes」:查看从节点 NodeManager 是否在线。


3. MapReduce 历史服务 Web UI(任务日志查看)
默认端口:19888(3.x/2.x 通用);
访问地址:http://主节点主机名/IP:19888(例:http://master:19888);
核心查看内容:
「Completed Applications」:查看已完成的 MapReduce 任务详情、日志(大赛中评委重点检查项,验证任务可追溯);
「Job History Configuration」:查看历史服务配置是否正常。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/12 10:22:37

任务一-1.子任务一:基础环境准备

1.子任务一&#xff1a;基础环境准备&#xff08;任务一&#xff09; 在master&#xff08;node1&#xff09;上安装jdk 1.安装并配置 Java 环境 Hadoop 等分布式框架依赖 Java&#xff0c;需安装 JDK&#xff08;推荐 JDK 8&#xff09;&#xff1b; 下载 JDK&#xff08;以j…

作者头像 李华
网站建设 2026/3/5 3:01:10

15、优化软件开发流程:从构建到测试的全面指南

优化软件开发流程:从构建到测试的全面指南 1. 分支管理的原则 在软件开发中,分支的使用需要谨慎。每个分支都会增加额外的开销和复杂性,因此团队应仅创建必要数量的分支,以支持并行开发和已发布版本的维护。例如,若团队在开发新功能的同时需要维护旧版本,就可能需要创建…

作者头像 李华
网站建设 2026/3/8 22:48:45

16、软件测试的高效实践与策略

软件测试的高效实践与策略 在软件测试领域,如何提高测试效率、减少资源浪费以及确保软件质量是至关重要的问题。本文将深入探讨软件测试中的多个关键方面,包括测试用例管理、测试结果与缺陷报告、测试自动化以及负载测试等内容。 测试用例管理与执行 测试用例如同其他工作…

作者头像 李华
网站建设 2026/3/11 19:04:47

18、软件开发流程改进与经验教训

软件开发流程改进与经验教训 1. 前期困境 在软件开发的收尾阶段极具不可预测性,就像难以知晓冰山藏于水下的部分大小一样,我们无法确切知道在产品发布中究竟还有多少实际工作要做。在 2005 年的发布周期里,我们遭遇了严重的进度延迟问题,等到产品发布时,团队士气也十分低…

作者头像 李华
网站建设 2026/3/12 16:47:46

Python+Vue的社区老年人帮扶系统 社区帮扶,岗位招聘,公益岗人员,急诊知识,代购 Pycharm django flask

这里写目录标题项目介绍项目展示详细视频演示感兴趣的可以先收藏起来&#xff0c;还有大家在毕设选题&#xff08;免费咨询指导选题&#xff09;&#xff0c;项目以及论文编写等相关问题都可以给我留言咨询&#xff0c;希望帮助更多的人技术栈文章下方名片联系我即可~解决的思路…

作者头像 李华
网站建设 2026/3/9 14:00:37

5大编程字体终极对决:从新手到专家的完整选择指南

5大编程字体终极对决&#xff1a;从新手到专家的完整选择指南 【免费下载链接】maple-font Maple Mono: Open source monospace font with round corner, ligatures and Nerd-Font for IDE and command line. 带连字和控制台图标的圆角等宽字体&#xff0c;中英文宽度完美2:1 …

作者头像 李华