mirror of https://github.com/newnius/Dockerfiles.git synced 2025-06-07 16:41:55 +00:00

History

based on sequenceiq/hadoop-docker

Create a hadoop cluster in swarm mode

--hostname needs 1.13 or higher

docker service create \
--name hadoop-master \
--network swarm-net \
--hostname hadoop-master \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop

docker service create \
--name hadoop-slave1 \
--network swarm-net \
--hostname hadoop-slave1 \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop

docker service create \
--name hadoop-slave2 \
--network swarm-net \
--hostname hadoop-slave2 \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop

docker service create \
--name hadoop-slave3 \
--network swarm-net \
--hostname hadoop-slave3 \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop

In the first deploy, format dfs first

sbin/stop-yarn.sh sbin/stop-dfs.sh

clear all data in /tmp in all nodes

bin/hadoop namenode -format

sbin/start-dfs.sh sbin/start-yarn.sh

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep input output 'dfs[a-z.]+'

Note: there is no such dir default, you can add data by

bin/hadoop dfs -mkdir -p /user/root/input

and

bin/hadoop dfs -put etc/hadoop/* /user/root/input

YARN: hadoop-master:8088

HDFS: hadoop-master:50070

Proxy needed, e.g. newnius/docker-proxy