Skip to main content

简介

在学习数据工程的过程中,我们常常需要使用到真实的环境。诸如Hadoop集群、Kafka集群等。对于数据开发人员而言,熟悉自己所学组件的部署过程过程也是十分重要的。
生产环境中我们使用到的集群通常是分布式部署,而在本地搭建分布式环境既繁琐又容易出错,当前项目中使用Docker来进行集群环境搭建

组件支持情况

组件版本支持备注
Hadoop3.4.2当前组件:namenode, datanode, resourcemanager, nodemanager
Hive3.1.3当前组件:metastore, hiveserver2
Hbase2.6.0-hadoop3当前组件:master, regionserver
Spark3.5.6-bin-hadoop3-scala2.13Standalone: master, worker
Flink1.20.2Standalone: jobmanager, taskmanager
Kafka2.13-3.8.0分布式,Broker, Connect
Zookeeper3.9.4分布式
ClickHouse24.2.2.71分布式
Airflow2.9.2Standalone: webserver, scheduler
ElasticSearch9.1.3分布式: elasticsearch
MongoDB8.0.12分布式sharding:configsvr, routersvr, shardsvr
Superset5.0.0Superset
Doris3.0.7分布式: FE, BE
Kudukudu-1.19.0-d40e0dc61分布式: Master, TServer。 自行编译版本,branch:master commitId: d40e0dc61
Impalaimpala-5.0.0-ec809fc16分布式: admissiond, statestored, catalogd, impalad 自行编译版本,branch:master commitId: ec809fc16
Nifi2.5.0Interface
tip

没有特殊说明登录账号和密码均为 admin/123456