[논문 읽기] Exploring the structure of a real-time, arbitrary neuralartistic stylization network 1

728x90

이전 논문은 이미지 하나당 optimization을 해야했다면 이 논문은 이런 점을 보완했다. (2015) A Neural Algorithm of Artistic Style

각각의 loss가 있다. style 이미지가 주어지면 style 예측 네트워크 P에서 S를 추출한다.

이게 style tranfer 네트워크 T에 콘텐츠 이미지 (입력이미지) 입력된다.

콘텐츠 이미지와 S가 T에 더해져 스타일이 입혀진 이미지가 생성된다.

스타일이 입혀진 이미지 VS 스타일 이미지

스타일이 입혀진 이미지 VS 콘텐츠 이미지

각각 거리를 최소화하는 방식으로 작동하기에, 콘텐츠의 내용을 잃지 않으면서 스타일을 학습할 수 있는 것이다.

두 이미지 Content가 유사하다 : 고 레벨 피쳐(추상적인 특징)의 거리가 가깝다. (유클리디언 거리)

-> 이미지에서 content가 담길, 의미가 있는? 추상화 된 정보들은 하이레벨 피쳐에서 얻어지게끔 학습되기 때문에

두 이미지 Style이 유사하다. : 저 레벨 피쳐(질감같은 세세한 특징)가 같은 공간통계를 동유한다.

-> 페인팅 style이 texture라는 가정하에, texture가 유사하단 건 저차원 공간상에 Gram matrix에 의해 표현되는 정보가 유사하단 말. Gram matrix는 skip

여하튼 content loss는 고레벨의 유클리디안 거리, style loss는 gram matrix에 의해 표현되는 저차원 공간상의 통계 정보 상의 거리로 표현돼서 이 둘을 조합한게 loss이다!

갑자기 이전의 관련 연구들을 소개한다. 도움이 될 것 같아 나도 소개한다.

-> 여전히 한계가 있었다. 훈련된 스타일에 한해서만 작동한다는 문제점. 일반적인 스타일에선 작동하지 않는다는 문제...

어떻게 해결할 것인가? 2편에 계속

[논문 읽기] Unsupervised Image to Image translation via pretrained stylegan2 network (2)	2021.03.18
[논문 읽기] Exploring the structure of a real-time, arbitrary neuralartistic stylization network - 2 (0)	2021.03.03
[논문 읽기] SeFa - Closed-Form Factorization of Latent Semantics in GANs 핵심 코드 분석 (0)	2021.02.17
[논문 읽기] End-to-end Recovery of Human Shape and Pose 핵심 정리 (0)	2021.02.16
[deep learning 논문 읽기] Stylegan2 ada 이해하기 (1)	2021.02.04

성장하는 나날들