본문 바로가기

반응형

deep learning

(25)
[deep learning] vit-adapter를 이용한 애완동물 segmentation banmo에 나오는 segmentation 모델 바꿔보기... 기존 모델을 분석하자 과제는 위 동물에대해 segmentation을 진행하는 것이다. cfg.MODEL_WEIGHTS 가 보이는가? 거기에서 힌트를 찾을 수 있다. 기존 banmo의 경우 rcnnX101을 이용해서 instance segmentation을 진행하고 있었다. detectron2에서 나름 최신 pretrained model을 이용하고 있을거라 추정되는데... 과연 어떤 모델인지는 두고보자. detectron2는 뭐냐하면? https://github.com/facebookresearch/detectron2 GitHub - facebookresearch/detectron2: Detectron2 is a platform for obje..
[논문 읽기] ConvLSTM 이해하기 시계열에 좋은 LSTM! 이미지에 좋은 Conv! 이 둘을 짬뽕시킨 Convolutional LSTM을 알아보자. LSTM에 대한 사전지식이 필요하다. https://limitsinx.tistory.com/62 [코드로 이해하는 딥러닝 2-11] - RNN(Recurrent Neural Network)/LSTM(Long-Short-Term-Memory) [코드로 이해하는 딥러닝 0] - 글연재에 앞서 https://limitsinx.tistory.com/27 [코드로 이해하는 딥러닝 1] - Tensorflow 시작 https://limitsinx.tistory.com/28 [코드로 이해하는 딥러닝 2] - Tensorflow 변.. limitsinx.tistory.com $i_t$는 입력 게이트, $f..
[pytorch error] GAN학습시 에러, RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation 에러 발생시 대처법 This happens because the opt_D.step() modifies the parameters of your discriminator inplace. But these parameters are required to compute the gradient for the generator. Hence the error. We fixed the inplace detection for the optimizers in 1.5, this is why it works in 1.4. You should re-organize your code to only do the steps() after all the gradients have been computed or make sure you don't mo..
[레이블링 툴] html, flask, python, javascript로 만드는 딥러닝 레이블링 툴 기본 html 기반으로 이미지위에 사각형이나 그림을 그리고 이를 저장하려면 어떻게 해야할까? 지금부터 그 방법을 소개한다. 필요도구 : javascript, d3.js. html, css base.html은 index navigator 역할을 한다. Drag the mouse to create a rectangle Rectangle 이미지 저장하기 {% endblock %} 저장을 누르면 다음과 같이 저장된다!! 몇시간 삽질했더라.... 지인의 조언을 얻지 못했으면 몇일은 헤맸을 텐데.. 하루삽질로 그침. 이 글을 보는 누군가는 행복하길! 키워드는 d3!
배경 차이가 뚜렷한 이미지에서, cv2.connectedComponetsWithStats 활용하여 객체 분리하고 자르기 + efficientDet image = cv2.imread('C:\\Users\\SGSDEV\\detection\\original\\6666.jpeg') img = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) _, src = cv2.threshold(img, 200, 255, cv2.THRESH_BINARY_INV) cnt, labels, stats, centroids = cv2.connectedComponentsWithStats(src) dst = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR) imgs = [] for i in range(1, cnt): # 각각의 객체 정보에 들어가기 위해 반복문. 범위를 1부터 시작한 이유는 배경을 제외 (x, y, w, h, area) = s..
[논문 읽기] Pixel-wise Anomaly Detection in Complex Driving Scenes 최근의 연구들은 비정상 지역을 확인하거나, 입력 이미지와의 이질감을 발견하기 위한 세그멘테이션 라벨맵으로 재합성하기 위해 세그멘테이션 불확실성을 이용하였다. 이 논문에선, 이 두 가지 방법이 추가 정보를 포함하고 있고 합쳐지면 더 비정상 세그멘테이션 과제에서 더 robust한 예측을 할 수 있다는 걸 설명한다. 픽셀별 비정상 탐지 프레임워크를 제시하는데, 이는 불확실성 맵을 이용해서 기존 재합성 방법(입력과 생성 이미지 사이의 이질감을 발견하는 방법)을 보다 향상 시킨다. - 기존에 있던 불확실성과 재합성 방법론의 가장 좋은 특징만을 잘 활용한 우수한 방법이다. - 다양한 비정상 시나리오에도 높은 성능을 나타낸다. - 다른 세그멘테이션 합성 네트워크에도 wrapper로써 일반화가 가능한 프레임워크다. -..
[논문 읽기] DRIT ++ 코드와 함께 이해하기, 논문 설명 기본적인 인코딩&디코딩 우선 도메인 A에 있는 이미지들이 인코더 A를 통과하여 콘텐츠 latent vector와 특성 latent. Vector를 출력합니다. B도 마찬가지로 진행합니다. 이후 콘텐츠 latent vector를 서로 교차하여 넣어주고, 특성 latent vector는 각 도메인에 맞게 Generator에 넣어줍니다. A Generator의 경우 도메인 a 특성 latent vector, b 콘텐츠 latent vector를 입력 값으로 받는다고 보시면 됩니다. B Generator의 경우 반대입니다. Reconstruction 과 랜덤 이미지 생성 3의 경우 Reconstruction loss를 위한 항입니다. A 도메인 본래의 특성 latent, 콘텐츠 latent를 A Generato..
[논문 읽기] Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks (Cycle GAN 논문 핵심만 정리) - 적대적 손실 (adversarial loss)을 활용하여 G(X)가 가 Y에서 온 분포와 유사하도록 $$ X \rightarrow Y $$ 맵핑을 학습하는 게 목표 - 이건 제약이 적기 없때문에 inverse mapping을 하나 추가한다. $$ Y \rightarrow X $$ 로 가는 것. 즉, $$ F(G(X)) \approx X $$ 이를 강제하는 cycle consitency loss를 소핸다. 2개의 맵핑 함수가 존재한다. G는 X를 Y로, F는 Y를 X로 맵핑 시키는 함수이다. X, Y는 각각 이미지 도메인이라고 생각하면 된다. $$ D_X $$는 Y에서 생성된 X가 최대한 실제 X 처럼 보이게끔 F를 조절하는 역할을 하고, $$ D_Y $$는 반대다. 그리고 여기서 2가지 사이클 일치 ..

728x90
반응형