본문 바로가기

반응형

Data-science

(128)
[imaginaire] coco-funit, mode collapse 문제 해결 삽질 coco-funit에서 발생한 문제 github.com/NVlabs/imaginaire/issues/43 mode collapse · Issue #43 · NVlabs/imaginaire hi, when I trained with coco_funit, In the first few epochs, the results are normal, but mode collapse appears from the 59th epoch. Is this normal? Will it also appear during your training? github.com Mode collapse... 해결 방안 1. learning rate 줄이기 - discriminator learning rate : 1e-4 -> 1e-5 - g..
[nvidia-docker] pytorch 실행시 메모리 문제 --ipc=host 부분을 run 시 추가해준다. curioso365.tistory.com/136 docker 컨테이너에서 pytorch 실행시 메모리 에러 해결 문제 docker에 pytorch 개발 환경을 구축하여 실행 시키고 컨테이너 안에서 관련 코드는 돌리니 다음과 같은 에러 메시지가 발생하였다. ERROR: Unexpected bus error encountered in worker. This might be caus.. curioso365.tistory.com
[nvidia-docker] NGC 설치로 pytorch build 필요없이 실행하기 - nvidia imaginaire 이용하는 법 하게된 배경 github.com/NVlabs/imaginaire NVlabs/imaginaire NVIDIA PyTorch GAN library with distributed and mixed precision support - NVlabs/imaginaire github.com imaginaire라는 라이브러리가 있다. 해당 라이브러리는 cuda 10.2로만 동작한다. RTX 30 시리즈는 cuda 10.2에서 지원하지 않는다는 게 문제... apex라는 라이브러리가 torch와 뭔가 연동이 되지 않아서 빌드부터 다시 해야한다고 들었다. 그런데 우리의 NGC는 apex와의 build를 cuda 11.2에서도 다 해놓았다! (NGC는 Nvidia Gpu Cloud의 약자로 Nvidia에서 AI를 쉽게 할..
[pytorch] type casting 하기, 타입 변환하기 가끔 가다가 RuntimeError: expected scalar type Float but found Double 이런 에러가 발생한다. 그럴경우... a 라는 텐서가 있으면 아래와 같이 케스팅해주면 된다. type도 변환된 자기 자신을 리턴한다. a = a.type(torch.FloatTensor).to(device)
[논문 읽기] Exploring the structure of a real-time, arbitrary neuralartistic stylization network - 2 - 네트워크가 명시적으로 훈련받은 스타일에만 작용한다. - 한 번도 보지못한, 혹은 많은 스타일에 대해서도 성능을 갖는 것이 목표. 이 방법의 장점 : 테스트 타임에 처음 보는 이미지에 대해 적절한 스타일을 예측할 수 있다! PCA를 한뒤, 중심 축을 평균, 각각 +- 2표준 편차씩 움직여서 변화를 봤다. style 이미지와 linear ineterpolation도 가능한 듯하다. github.com/magenta/magenta/tree/master/magenta/models/arbitrary_image_stylization magenta/magenta Magenta: Music and Art Generation with Machine Intelligence - magenta/magenta github...
[논문 읽기] Exploring the structure of a real-time, arbitrary neuralartistic stylization network 1 이전 논문은 이미지 하나당 optimization을 해야했다면 이 논문은 이런 점을 보완했다. (2015) A Neural Algorithm of Artistic Style 각각의 loss가 있다. style 이미지가 주어지면 style 예측 네트워크 P에서 S를 추출한다. 이게 style tranfer 네트워크 T에 콘텐츠 이미지 (입력이미지) 입력된다. 콘텐츠 이미지와 S가 T에 더해져 스타일이 입혀진 이미지가 생성된다. - Style loss 스타일이 입혀진 이미지 VS 스타일 이미지 - Content loss 스타일이 입혀진 이미지 VS 콘텐츠 이미지 각각 거리를 최소화하는 방식으로 작동하기에, 콘텐츠의 내용을 잃지 않으면서 스타일을 학습할 수 있는 것이다. 두 이미지 Content가 유사하다 :..
[논문 읽기] SeFa - Closed-Form Factorization of Latent Semantics in GANs 핵심 코드 분석 transformation matrix A에 대해 조사해야한다. 왜냐면 An의 최댓값을 이미지 Edit을 최대화 시킬 수 있기 때문이다. 그래서 A^TA의 고유벡터와 고유값을 찾는다. gan_type = parse_gan_type(net.decoder) layers, boundaries, values = factorize_weight(net.decoder, args.layer_idx) generator의 weight와 layer 인덱스를 인자로 받고, 그 결과로 layers, boundarys, values를 내 뱉는다. 문맥상 layers는 이미지 Edit에 관여된 layer들을 의미하고, boundarys가 고유 벡터, values가 고유값을 의미하는 듯하다. 위 값들은 실제 코드에 어떻게 쓰일까? ..
[논문 읽기] End-to-end Recovery of Human Shape and Pose 핵심 정리 논문 2D Image → 3d image keypoints를 다시 projection했을 때 발생하는 reprojection loss를 최소화 하는 게 핵심 이걸 가능하게 하기위해 적대적으로 학습함 (사람의 체형이나 포즈 파라미터가 real 인지 아닌지를) 2d keypoint detection에 의존하지 않고 이미지 픽셀에서 바로 3d 파라미터(체형, 포즈)를 추론한다. 전체적인 기술 설명 이미지가 CNN을 통해 인코딩된다. 인코딩된 latent vector는 3차원 회귀(regression) 모듈에 보내진다. 이 모듈에서 사람의 3차원 형상을 표현하는 걸 배운다. 이 때 회귀모듈에서 나온 3차원 형상을 표현하는 latent vector(s, R, T, 베타, 세타)들은 reprojection erro..

728x90
반응형