集群环境
集群规划的环境有五台机器组成,分别是客户端(1台),控制节点(1台),计算节点(3台),组网图如图1所示。其中控制节点作为大数据集群的server端,计算节点分别是大数据集群的agent1、agent2和agent3。在POC测试场景下,客户端可部署在控制节点上。
集群硬件配置
集群(控制节点和计算节点)所使用的环境如表1所示:
集群软件版本
使用到的相关软件版本如下表2所示:
项目 |
要求 |
---|---|
OS |
openEuler-20.03-LTS-SP1 |
JDK |
毕昇jdk version 1.8.0_272 |
ZooKeeper |
3.4.9 |
Hadoop |
3.1.1 |
Spark |
Apache Spark 2.3.2或2.4.6 |

- Spark部署模式为Spark on Yarn。
- 当前鲲鹏算法库兼容Apache Spark 2.3.2以及Apache Spark2.4.6版本,其他平台暂未验证,基于安全诉求,建议使用高版本。
父主题: 软件安装部署