Make sure all Torch Distributed initialization use `device_id=torch.device(f"cuda:{device_id}")`

We have some code that looks like this:
```python
    dist.init_process_group(
        backend="nccl",
        rank=rank,
        world_size=world_size,
        init_method="tcp://127.0.0.1:29500"
)
```
ALL code should look like this:
```python
    dist.init_process_group(
        backend="nccl",
        rank=rank,
        world_size=world_size,
        init_method="tcp://127.0.0.1:29500",
        device_id=torch.device(f"cuda:{device_id}")
    )

```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Make sure all Torch Distributed initialization use `device_id=torch.device(f"cuda:{device_id}")` #202

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Make sure all Torch Distributed initialization use device_id=torch.device(f"cuda:{device_id}") #202

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

Make sure all Torch Distributed initialization use `device_id=torch.device(f"cuda:{device_id}")` #202