【WIP】fleet support dygraph in mnist/resnet/transformer #4811

danleifeng · 2020-08-21T09:37:33Z

main change:

from paddle.distributed import fleet

fleet.init(is_collective=True)
adam = fleet.distributed_optimizer(adam)
# call after distributed_optimizer so as to apply dist_strategy
mnist = fleet.build_distributed_model(mnist)

Sample code:

import paddle
import paddle.nn as nn
import paddle.optimizer as opt
from paddle.distributed import fleet

class LinearNet(nn.Layer):
    def __init__(self):
        super(LinearNet, self).__init__()
        self._linear1 = nn.Linear(10, 10)
        self._linear2 = nn.Linear(10, 1)
        
    def forward(self, x):
        return self._linear2(self._linear1(x))

def train():
    # 1. enable dynamic mode
    paddle.disable_static()
    
    # 2. create layer & optimizer
    layer = LinearNet()
    loss_fn = nn.MSELoss()
    adam = opt.Adam(
        learning_rate=0.001, parameters=layer.parameters())

    # 3. get data_parallel model using fleet
    fleet.init(is_collective=True)
    adam = fleet.distributed_optimizer(adam)
    # call after distributed_optimizer so as to apply dist_strategy
    dp_layer = fleet.build_distributed_model(layer)
    
    # 4. run layer
    inputs = paddle.randn([10, 10], 'float32')
    outputs = dp_layer(inputs)
    labels = paddle.randn([10, 1], 'float32')
    loss = loss_fn(outputs, labels)
    
    loss = dp_layer.scale_loss(loss)
    loss.backward()
    dp_layer.apply_collective_grads()

    adam.step()
    adam.clear_grad()

if __name__ == '__main__':
   train()

danleifeng added 2 commits August 21, 2020 09:36

fleet support dygraph in mnist/resnet/transformer

9dd223c

remove role_maker

6902590

chenwhql mentioned this pull request Aug 25, 2020

Add interface to launch parallel dygraph by multiprocessing PaddlePaddle/Paddle#26044

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

【WIP】fleet support dygraph in mnist/resnet/transformer #4811

【WIP】fleet support dygraph in mnist/resnet/transformer #4811

Uh oh!

danleifeng commented Aug 21, 2020 •

edited

Loading

Uh oh!

Uh oh!

【WIP】fleet support dygraph in mnist/resnet/transformer #4811

Are you sure you want to change the base?

【WIP】fleet support dygraph in mnist/resnet/transformer #4811

Uh oh!

Conversation

danleifeng commented Aug 21, 2020 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

main change:

Sample code:

Uh oh!

Uh oh!

danleifeng commented Aug 21, 2020 •

edited

Loading