콘솔 환경에서 torch.distributed.launch를 이용하여 분산학습을 수행 할 경우에는 아래와 같이 사용이 가능하다
$ python -m torch.distributed.launch --params=value train.py
pycharm 환경에서 script의 파라미터를 주는 방법은 많이들 쓰니 잘 알지만
모듈을 실행하는 방법은 잘 몰라서 검색 후 사용 방법을 기록.
1. Edit configurations 진입
2. Configuration 탭의 Script Path 항목을 눌러 Module name으로 변경
3. Module name 에 모듈 이름을, parameters에 모듈 파라미터와 사용할 스크립트 정보를 입력
예) Module name: torch.distributed.launch
Parameters: --params=value train.py
4. 해당 모듈 실행
위 방법을 이용하여 파이참 환경에서도 torch.distributed.launch 모듈을 이용한
다중 GPU 분산 학습이 가능함을 확인 완료.
'전공관련 > Deep Learning' 카테고리의 다른 글
[Pytorch] Boolean value of Tensor with more than one value is ambiguous 에러를 해결하자. (0) | 2023.06.07 |
---|---|
[MXNet] 데이터 리스트를 만들고 rec 파일로 만들어 보자 (0) | 2022.04.01 |
[Tensorflow] h5py 관련 오류를 해결하자 (0) | 2021.04.26 |
[ONNX] cuda 버전에 따른 python onnxruntime 버전을 맞추자. (0) | 2021.03.09 |
[용어] Ablation Study (0) | 2021.02.25 |