Linux虚拟机CentOs7 hadoop伪分布式安装
一、虚拟机环境配置(root登录状态)
1.修改主机名
vi /etc/hostname ##为了方便记忆,这边修改为hadoop
2.修改IP为静态
vi /etc/sysconfig/network-scripts/ifcfg-eno16777736
##这里的网卡名称可能与大家的会不一样
##将红框内的内容修改为如下图所示,其中BOOTPROTO修改为static 即为静态
##IPADDR,GATEWAY,DNS1则根据大家自己电脑的IP修改
# ONBOOT修改为yes,即开机启动
3.修改hosts文件
vi /etc/hosts
##在文件中添加红框内容,ip地址是自己设置的静态地址,主机名为第一步设置的名称
4.修改完成之后重启虚拟机。
5.关闭防火墙
systemctl stop firewalld ##关闭当前防火墙
systemctl disable firewalld #关闭防火墙开机启动
6.创建hadoop用户
useradd hadoop #添加hadoop用户
passwd hadoop #设置hadoop用户的密码为hadoop
7.配置hadoop用户具有root权限
vi /etc/sudoers
#找到文件中Allow root to run any commands anywhere 这一行
#添加 hadoop ALL=(ALL:ALL) NOPASSWD:ALL
#若root用户也无法修改该文件,则使用 visudo -f /etc/sudoers
8.安装必要的依赖
yum install -y epel-release
yum install -y psmisc nc net-tools rsync vim lrzsz ntp libzstd openssl-static
注意:若yum安装过程中出现如下错误
打开/etc/yum.repos.d/epel.repo
vi /etc/yum.repos.d/epel.repo
#将baseurl行的注释去掉,将metalink行注释掉,再重新执行yum安装命令
9.安装包准备
① JDK 本次安装的为jdk1.8版本:jdk-8u73-linux-x64.gz
② hadoop 本次安装的为hadoop2.7版本:hadoop-2.7.2.tar.gz
#创建软件安装包存放目录
mkdir /opt/
二、安装JDK(这里使用hadoop用户登录)
首先查看是否已安装了jdk
rpm -qa |grep java
#存在openjdk,需要先卸载
sudo rpm -e --nodeps 文件名
2. 解压jdk压缩包
tar -zvxf jdk-8u73-linux-x64.gz
mv jdk1.8.0_73 ../user/jdk
3.配置环境变量
sudo vi /etc/profile.d/my_env.sh
#添加图中语句,重启shell窗口,查看是否生效
#重启shell窗口后执行
java -version
JDK安装成功。
三、hadoop安装
1.解压安装包
tar -zvxf hadoop-2.7.2.tar.gz -C /opt/soft/
mv /opt/soft/hadoop-2.7.2 /opt/soft/hadoop #这里为了方便改名为hadoop
2.配置环境变量
sudo vi /etc/profile.d/my_env.sh
#重启shell窗口,查看是否生效
hadoop version
3.配置免密登录
ssh-keygen -t rsa
#连续回车即可
#将公钥拷贝到需要免密登录的节点。我们是伪分布式,所以节点就只有hadoop一台
ssh-copy-id hadoop
#会需要输入一次hadoop的密码
#验证是否免密登录成功
ssh hadoop
#如下图所示表示免密登录成功
4.修改hadoop配置文件
① 修改hadoop-env.sh
vi /opt/soft/hadoop/etc/hadoop/hadoop-env.sh
#将jdk路径填入
②修改core-site.xml文件
vi /opt/soft/hadoop/etc/hadoop/core-site.xml
③修改hdfs-site.xml
vi /opt/soft/hadoop/etc/hadoop/hdfs-site.xml
④修改mapred-site.xml
cp mapred-site.xml.template mapred-site.xml
vi mapred-site.xml
⑤修改yarn-site.xml文件
vi yarn-sit.xml
⑥配置slaves
vi slaves
#因为咱们是伪分布式,所以节点也只有hadoop一台
四、启动hadoop
1.格式化
hdfs namenode -format
#若是Exiting with status 0 则格式化成功
2.启动hdfs
star-dfs.sh
jps #查看进程
浏览器验证,输入 IP:50070
3.启动yarn
start-yarn.sh
jps #查看进程
浏览器验证 IP:8088
至此,centos7安装hadoop2.7 伪分布式 完成!!!