Dockerfiles

mirror of https://github.com/newnius/Dockerfiles.git synced 2025-06-07 00:21:56 +00:00

History

newnius 10962791c8 add spark		2017-04-08 22:22:34 +08:00
..
bootstrap.sh	stop before start, hadoop	2017-02-26 16:08:21 +08:00
core-site.xml	add hadoop	2017-02-26 15:16:53 +08:00
Dockerfile	add hadoop	2017-02-26 15:16:53 +08:00
hdfs-site.xml	add hadoop	2017-02-26 15:16:53 +08:00
mapred-site.xml	add hadoop	2017-02-26 15:16:53 +08:00
README	add spark	2017-04-08 22:22:34 +08:00
slaves	add hadoop	2017-02-26 15:16:53 +08:00
yarn-site.xml	add hadoop	2017-02-26 15:16:53 +08:00

README

# based on sequenceiq/hadoop-docker

## Create a hadoop cluster in swarm mode

`--hostname` needs 1.13 or higher

```
docker service create \
--name hadoop-master \
--network swarm-net \
--hostname hadoop-master \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop
```

```
docker service create \
--name hadoop-slave1 \
--network swarm-net \
--hostname hadoop-slave1 \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop
```

```
docker service create \
--name hadoop-slave2 \
--network swarm-net \
--hostname hadoop-slave2 \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop
```

```
docker service create \
--name hadoop-slave3 \
--network swarm-net \
--hostname hadoop-slave3 \
--replicas 1 \
--endpoint-mode dnsrr \
newnius/hadoop
```

## Init && Test

In the first deploy, format dfs first

### stop cluster (in master)
`sbin/stop-yarn.sh`
`sbin/stop-dfs.sh`

### remove previous data (in all nodes)
clear all data in /tmp in all nodes

### format hdfs (in master)
```
bin/hadoop namenode -format
```

### start cluster (in master)
`sbin/start-dfs.sh`
`sbin/start-yarn.sh`

### Run a test job

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep input output 'dfs[a-z.]+'

Note: there is no such dir default, you can add data by

```
bin/hadoop dfs -mkdir -p /user/root/input
```
and
```
bin/hadoop dfs -put etc/hadoop/* /user/root/input
```

### monitor cluster in browser

YARN: hadoop-master:8088

HDFS: hadoop-master:50070

_Proxy needed, e.g. newnius/docker-proxy_