军事新闻

大数据:hadoop多节点集群搭建指南_科技频道_东方资讯

1、多节点集群架构设计

后续介绍的hadoop多节点集群由三台计算机构成:一台主节点为master,两台从节点为slave1、slave2。

master节点上主要运行namenode、Resourcemanager 进程;slave节点上运行datanode、nodemanager进程。

由于大家一般只有一台计算机,因此我们使用虚拟机软件VMware workstation虚拟出三台计算机来分别运行master、slave1、slave2节点。因为是虚拟出的集群,所以跟实际的进群还是有差距的,不会体会到真正的并行计算与并行存储的优势。实际工作中整个集群会有十几个甚至上百个节点,可以批量处理以T为单位的数据。然而 他们 配置方法是大致相同的,运行过程也是一致的,区别只是在运行速度和存储数据量上会体现出来。

为了简化安装过程,我们将在之前的伪分布集群基础上通过修改配置文件等操作来创建master节点。

2、复制伪分布集群节点

首先需要复制之前安装配置过伪分布集群的虚拟机。具体操作步骤如下:

1)启动VMware Workstation,选择 虚拟机->管理->克隆

单击下一步继续

克隆自 选择虚拟机中的当前状态,然后单击下一步