hadoop3.3完全分布式(最简)

news/2024/7/24 12:30:26 标签: 分布式, linux, hadoop

环境准备

  • 3台CentOS7(本例使用VMware替代)
  • jdk8
  • Hadoop3.3

虚拟机基础准备

  • 网络适配器选用NAT模式(针对VMware)
  • 设置静态IP,对应关系如下
名称地址
hadoop01192.168.138.201
hadoop02192.168.138.202
hadoop03192.168.138.203
  • 设置主机名,在各自机器上执行hostnamectl set-hostname 主机名称即可
  • 将jdk、Hadoop安装包分别上传至hadoop01:/hadoop目录下

接下来的操作,我会标明在那个机器里面操作,执行的时候切记不要执行错了

hadoop01_19">hadoop01中执行

解压安装包
cd /hadoop
// 解压jdk
tar -xzvf jdk*
// 解压hadoop
tar -xzvf hadoop*
// 删除安装包
rm -rf ./*.gz
// 重命名jdk
mv jdk* jdk8
// 重命名hadoop
mv hadoop* hadoop3
安装jdk

使用命令vi /etc/profile将如下代码添加到末尾

export JAVA_HOME=/hadoop/jdk8
export CLASSPATH=.$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH

配置完成后执行source /etc/profile重新加载配置文件
然后使用java -version测试jdk是否安装成功

安装Hadoop

1、配置环境变量

使用命令vi /etc/profile将如下代码添加到末尾

export HADOOP_HOME=/hadoop/hadoop3
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

配置完成后执行source /etc/profile重新加载配置文件

2、修改Hadoop配置文件

涉及修改的文件有core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml、yarn-site.xml、workers

  • core-site.xml
 <property>
     <name>fs.defaultFS</name>
     <value>hdfs://hadoop01:9000</value>
 </property>
export JAVA_HOME=/hadoop/jdk8
export HDFS_NAMENODE_USER="root"
export HDFS_DATANODE_USER="root"
export HDFS_SECONDARYNAMENODE_USER="root"
export YARN_RESOURCEMANAGER_USER="root"
export YARN_NODEMANAGER_USER="root"
  • hdfs-site.xml
  <property>
    <name>dfs.replication</name>
    <value>2</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/hadoop/hadoop3/hdfs/name</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/hadoop/hadoop3/hdfs/data</value>
  </property>
<!-- nn web 端访问地址--> 
  <property> 
    <name>dfs.namenode.http-address</name> 
    <value>hadoop01:9870</value> 
  </property> 
  <property>
    <name>dfs.permissions</name>
    <value>false</value>
  </property>
  • mapred-site.xml
  <property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
  </property>
  • yarn-site.xml
  <property>
    <name>yarn.resourcemanager.hostsname</name>
    <value>hadoop01</value>
  </property>
  <property>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>hadoop01:8088</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  • workers
hadoop01
hadoop02
hadoop03
修改hosts文件

使用vi /etc/hosts编辑文件,在末尾加入

192.168.138.201 hadoop01
192.168.138.202 hadoop02
192.168.138.203 hadoop03
hadoop_146">将jdk、hadoop等文件分发给其他机器
// hadoop02
// 配置文件
scp -r /etc/profile hadoop02:/etc/
// 映射关系
scp -r /etc/hosts hadoop02:/etc/
// 安装文件
scp -r /hadoop hadoop02:/

// hadoop03
scp -r /etc/profile hadoop03:/etc/
scp -r /hadoop hadoop03:/
scp -r /etc/hosts hadoop03:/etc/

以下命令三个机器全部执行

1、刷新配置文件

source /etc/profile

2、配置ssh免密登录

  • 生成密钥(一路回车直到结束)
ssh-keygen -t rsa
  • 分发公钥
ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop03

3、关闭防火墙

systemctl stop firewalld.service
systemctl disable firewalld.service

hadoop01_191">hadoop01中执行

  • 格式化namenode
hdfs namenode -format
start-all.sh

到此搭建已经完成,访问web页面http://192.168.138.201:8088即可,


http://www.niftyadmin.cn/n/5267248.html

相关文章

共同编辑文档功能实现(websocket)

目录 前言 websocket封装 wangeditor下载 共同编辑文档代码实现 HTML样式部分 JS部分 css部分 前言 功能&#xff1a;实现文档共同编辑功能&#xff0c;可以实时接收到其他人的信息 思路&#xff1a;先调用接口获取相应的数据进行渲染&#xff0c;然后通过webSocket建…

MySQL 是什么?

MySQL官方网站&#xff08;http://www.mysql.com/&#xff09;提供关于MySQL软件的最新信息。 MySQL是一个数据库管理系统。 数据库是一种结构化的数据集合。它可以是从简单的购物清单到图片库&#xff0c;再到企业网络中的大量信息等任何形式。要添加、访问和处理存储在计算…

4、APScheduler: 详解Scheduler种类用法、常见错误与解决方法【Python3测试任务管理总结】

调度器(Scheduler)是将其他组件绑在一起的关键。通常在应用程序中只运行一个调度器。应用程序开发者通常不直接处理作业存储(job stores)、执行器(executors)或触发器(triggers)。相反,调度器提供了适当的接口来处理所有这些。通过调度器配置作业存储和执行器,以及添…

(2021|ICCV,DINO,ViT,自监督学习,知识蒸馏)自监督视觉 Transformer 的新特性

Emerging Properties in Self-Supervised Vision Transformers 公纵号&#xff1a;EDPJ&#xff08;添加 VX&#xff1a;CV_EDPJ 或直接进 Q 交流群&#xff1a;922230617 获取资料&#xff09; 目录 0. 摘要 1. 简介 2. 相关工作 3. 方法 3.1. 自监督学习与知识蒸馏 …

vue-实现高德地图-省级行政区地块显示+悬浮显示+标签显示

<template><div><div id"container" /><div click"showFn">显示</div><div click"removeFn">移除</div></div> </template><script> import AMapLoader from amap/amap-jsapi-load…

DevEco Studio快捷键指南

DevEco Studio是一款用于开发嵌入式应用的集成开发环境&#xff08;IDE&#xff09;&#xff0c;它提供了许多快捷键&#xff0c;可以帮助开发者更高效地编写代码。本文将介绍DevEco Studio中的一些常用快捷键&#xff0c;帮助你更好地利用这个工具。 一、常用快捷键 快速打开…

关于“Python”的核心知识点整理大全22

目录 ​编辑 9.4.2 在一个模块中存储多个类 虽然同一个模块中的类之间应存在某种相关性&#xff0c;但可根据需要在一个模块中存储任意数量的 类。类Battery和ElectricCar都可帮助模拟汽车&#xff0c;因此下面将它们都加入模块car.py中&#xff1a; car.py my_electric_car…

<软考高项备考>《论文专题 - 12 绩效域(二)》

4 团队绩效域 团队绩效域涉及项目团队人员有关的活动和职能。在项目整个生命周期过程中&#xff0c; 有效执行本绩效域可以实现预期目标&#xff0c;主要包含&#xff1a; ①共享责任&#xff1b; ②建立高绩效团队&#xff1b; ③所有团队成员都展现出相应的领导力和人际关系…