


Hadoop 2.x 需要至少 2 台机器(一台主节点,一台从节点)以及足够的内存和磁盘空间,具体硬件需求如下:


主节点:4 核 CPU、8GB 内存、500GB 磁盘空间

从节点:2 核 CPU、4GB 内存、500GB 磁盘空间


在 Linux 环境下部署 Hadoop 2.x,需要安装以下软件包:

Apache Hadoop 2.x

Java Development Kit (JDK) 1.8

Apache Maven 3.5.x


SSH 客户端(如 OpenSSH)


确保所有机器之间可以互相访问,并且防火墙允许 SSH 连接,在主节点上创建一个新的用户,并为其分配 SSH 权限,创建一个名为 "hadoop" 的用户:

sudo useradd hadoop
sudo passwd hadoop

下载并解压 Hadoop

1、在 Apache Hadoop 官网下载最新版本的 Hadoop 2.x,选择合适的压缩包格式(tar.gz 或 tar.bz2),下载 tar.gz 格式的 Hadoop:



tar -zxvf hadoop-2.9.3.tar.gz

配置 Hadoop


编辑 ~/.bashrc 文件,添加以下内容:


export HADOOP_HOME=/path/to/hadoop-2.9.3
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop


source ~/.bashrc

2、配置 Hadoop 核心组件参数

编辑 $HADOOP_CONF_DIR/core-site.xml$HADOOP_CONF_DIR/hdfs-site.xml$HADOOP_CONF_DIR/mapred-site.xml$HADOOP_CONF_DIR/yarn-site.xml 文件,根据实际需求进行配置,设置 HDFS 的副本数:


配置 SSH免密登录(可选)

为了方便操作,可以配置 SSH免密登录,在主节点上生成 SSH 密钥对:

ssh-keygen -t rsa -P '' -f $HOME/.ssh/id_rsa

将公钥复制到从节点的 ~/.ssh/authorized_keys 文件中:

cat $HOME/.ssh/ | ssh user@slave_ip "mkdir -p $HOME/.ssh && cat >> $HOME/.ssh/authorized_keys"

启动 Hadoop 各组件(可选)

