Name	Name	Last commit message	Last commit date
parent directory ..
kafka	kafka
spark	spark
README.md	README.md
docker-compose.yml	docker-compose.yml

Name

Last commit message

Last commit date

Running Spark and Kafka Clusters on Docker

1. Build Required Images for running Spark

The details of how to spark-images are build in different layers can be created can be read through the blog post written by André Perez on Medium blog -Towards Data Science

# Build Spark Images
./build.sh

2. Create Docker Network & Volume

# Create Network
docker network  create kafka-spark-network

# Create Volume
docker volume create --name=hadoop-distributed-file-system

3. Run Services on Docker

# Start Docker-Compose (within for kafka and spark folders)
docker compose up -d

In depth explanation of Kafka Listeners

Explanation of Kafka Listeners

4. Stop Services on Docker

# Stop Docker-Compose (within for kafka and spark folders)
docker compose down

5. Helpful Comands

# Delete all Containers
docker rm -f $(docker ps -a -q)

# Delete all volumes
docker volume rm $(docker volume ls -q)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

Running Spark and Kafka Clusters on Docker

1. Build Required Images for running Spark

2. Create Docker Network & Volume

3. Run Services on Docker

4. Stop Services on Docker

5. Helpful Comands

FilesExpand file tree

docker

Directory actions

More options

Directory actions

More options

Latest commit

History

docker

Folders and files

parent directory

README.md

Running Spark and Kafka Clusters on Docker

1. Build Required Images for running Spark

2. Create Docker Network & Volume

3. Run Services on Docker

4. Stop Services on Docker

5. Helpful Comands