본문 바로가기

분류 전체보기

(290)
[opencv-python] 이미지 boundary detection, rectangle detection 이미지내 객체 사각형 테두리 만들기 일단 이미지를 불러옵니다. 이미지에서 한자 글자 외부에만 사각형을 빨간 테두리로 치는게 목표입니다. 한자 글자 사이사이 띄어진 여백때문에 경계가 나눠질 수도 있으므로 블러를 해줍니다. 여백이 너무 적어보여 여백을 추가해서 보다 실전에 가깝게 만들어줍시다. cv2.connectedComponentsWithStats를 이용해서 해당 영역의 x, y, w, h 좌표를 구합니다. 그리고 cv2.rectangle을 이용해서 이를 그려줍니다. 전체 코드는 아래에!! image = (plt.imread('dataset/茄/茄 22.png') * 255.).astype(np.uint8) image = cv2.resize(image, (256, 256)) plt.imshow(image) blur = cv2.Gaussia..
[논문 읽기] Three-D Safari: Learning to Estimate Zebra Pose, Shape, and Texturefrom Images “In the Wild”
librosa.load와 scipy.sio.wavefile read가 다른 점 librosa의 normalization 방법 scipy.sio.wavefile.read를 쓰면 int16으로 값을 읽어들인다. 즉 2바이트 librosa.load를 쓰면 float32, 4바이트로 값을 읽어들인다. 오잉?? 대체 뭘까 궁금해서 조사해봤다. 평균과 min, max를 조사해보니 왠지 표준 정규화를 해준것 같아서 그대로 해주어보았다. 오잉 값이 다르다.... 이러면 안되는데?? 그러면 방법은... librosa.load를 뜯어 분해하는 수 밖에 없다... 그렇게 찾아낸 함수가 아래함수!! 위 함수를 쓰니 결과는? 같다. 이 함수를 이용하자. https://librosa.org/doc/main/generated/librosa.util.buf_to_float.html librosa.util.buf_to_float — librosa 0.9.0..
[flask] json 객체 등 javascript에서 flask, python으로 데이터 보내기 https://sncap.tistory.com/963
[flutter] 앱 개발하면서 삽질 했던 경우 consturctor를 제대로 알지 못해서... class ResultPage extends StatelessWidget { ResultPage( {@required this.BMIResult, @required this.interpretation, @required this.BMI }); final String BMIResult; final String BMI; final String interpretation; 위에 this가 들어가야하는데 this를 빼먹고 해서 자꾸 에러가 났음... 디버깅 에러는 없는데 이럴수가.. 내 1시간... 그리고 다른 삽질은 extract widget이 안돼서 직접 입력했는데 아무리 해도 안되더라 왠지 보니 constructor에서 ({})이거 인데 ()게만 초기화했더라..
[socket 통신] python. int 혹은 float을 little endian 방식의 bytearray로 변환해 전송하기 struct라는 내장 모듈을 활용한다!! import sturct a = 34531 byte_a = struct.pack('
[논문 읽기] UIS-RNN 설명, FULLY SUPERVISED SPEAKER DIARIZATION 설명 - 수식 설명 수식 설명 추가) $$ x_t | x_[t-1], y_[t] $$ 의 분포를 정규분포로 가정하고 있습니다. $$ x_[t-1], y_[t] $$ 는 각각 t-1까지의 sequence들, t까지의 청자 정보들입니다. 이 둘을 알고 있을 때 t에서의 sequence의 분포를 가정하는 것이지요. 가령 그림에서 보면 $y_7$=1, 2, 3, 4 경우의 수를 갖고 있지요. x는 $x_6$까지 알고 있는 상황이고요. 이런 상황일 때 $x_7$이 무엇이냐를 말하는 것입니다. 평균 $$u_t$$를 보았을 때 (분모/분자로 나눌 수 있는데 둘 다) 1모양의 binary indicator가 있습니다. 이는 이전의 화자랑 특정 화자가 같으면 1, 아니면 0을 나타내고 이를 다 더한 후 역수를 취한 값입니다. 가령 위 그림..
[논문 읽기] UIS-RNN 설명, FULLY SUPERVISED SPEAKER DIARIZATION 설명 - 2 어려운 수식들이 등장한다. x_t의 사후확률이, 뮤(u)라 쓰겠다. u_t를 평균으로 하는 정규 분포를 따른다고... 위 수식적인 설명보단 그림을 통해 이해하는게 더 빠르다. 점선을 기준으로 왼쪽이 알고 있는 부분, 오른쪽이 새로운 가능성인 부분이다. 왼쪽 부분에서 화자는 (파랑,파랑, 노랑, 분홍, 노랑, 노랑)으로 분리 된다. 그러면 그 다음 화자는? 기존의 파랑, 노랑, 분홍 중 하나이거나 다른 색깔(초록)일 수도 있다. 그 확률이 이전에 나온 y 수열과 x 수열에 영향을 받는 것이다. 수식이 꽤 어렵다.. 1 번에서 말했듯 밑줄친 저 결합확률의 로그를 최대화하는 게 목적이다. g를 간단하게 상수로 놓으면 해가 간단해진다. 그런데 세타와 시그마제곱은 이게 어렵다. 그래서 확률적 경사 상승법 (sgd..

728x90