Performance Tests for nkmpi4py

This repository tests the performance of 3 types of parallel training strategies using Slurm Workload Manager or MPI:

tf.distribute.experimental.MultiWorkerMirroredStrategy
tf.distribute.experimental.ParameterServerStrategy
Distributed training with nkmpi4py.

Usage

Configurations

# Number of tasks to run.
n_tasks=10

# Available strategies: 
# 1) nkmpi4py
# 2) multi_worker_mirrored
# 3) parameter_server
strategy=nkmpi4py

# Available modes:
# 1) slurm
# 2) mpi
mode=slurm

Use Slurm Workload Manager

yhrun -N "$n_tasks" -n "$n_tasks" -c 16 -p nankai -u --mpi pmix python src/strategy_"$strategy".py --mode "$mode" --epochs 1 --block_hidden_dims "(2048, 2048)" --allreduce_dims "($n_tasks,)"

Use MPI

mpiexec -n "$n_tasks" python src/strategy_"$strategy".py --mode "$mode" --epochs 1 --block_hidden_dims "(2048, 2048)" --allreduce_dims "($n_tasks,)"

Flags

--learning_rate=LEARNING_RATE
    Type: float
    Default: 0.001
--batch_size=BATCH_SIZE
    Type: int
    Default: 64
--epochs=EPOCHS
    Type: int
    Default: 10
--steps_per_epoch=STEPS_PER_EPOCH
    Type: int
    Default: 70
--block_hidden_dims=BLOCK_HIDDEN_DIMS
    Type: typing.Sequence
    Default: (64, 64)
--n_block=N_BLOCK
    Type: int
    Default: 2
--allreduce_dims=ALLREDUCE_DIMS
    Type: typing.Sequence
    Default: (10,)
 --mode=MODE
    Type: str
    Default: 'slurm'

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

Uh oh!

Repository files navigation

Performance Tests for nkmpi4py

Usage

Configurations

Use Slurm Workload Manager

Use MPI

Flags

About

Uh oh!

Languages

Uh oh!

License

Uh oh!

alumik/nkmpi4py-perf

Folders and files

Latest commit

History

Repository files navigation

Performance Tests for nkmpi4py

Usage

Configurations

Use Slurm Workload Manager

Use MPI

Flags

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Languages