AI/Model (Study)

    [Openpose] 오픈소스 사용

    [Openpose] 오픈소스 사용

    Pose Estimation 의 한 분야이며, 사람의 마디를 정확히 예측한다.즉 사람의 스켈레톤을 뽑아내는 모델이다. 가장 알려진? openpose 모델은 COCO18, BODY-25, MPII 이다.세 개 모델은 뽑는 골격의 개수가 다르다. 각각 18개, 25개, 15개의 골격 포인트를 추출한다.    사실 나는 CP-VTON 진행 중 알게된 부분이다.위 모델에는 다음과 같은 학습 데이터를 필요로 한다.옷 이미지해당 옷을 입은 사람 이미지옷 이미지 segmentation 결과사람의 keypoint여기서 사람의 keypoint 가 사람의 골격 포인트에 해당한다. 즉 openpose를 사용해서 뽑아야 하는 정보이다.  내가 사용한 CP-VTON 오픈소스 코드에는 테스트용 파일이 들어있는데,keypoint ..

    [GAN] 다양한 GAN의 이론 설명

    [GAN] 다양한 GAN의 이론 설명

    DCGAN표준정규분포로 얻어진 벡터를 샘플링하고 컨볼루션 기반의 레이어를 통과. PGGAN고해상도 이미지를 위해 점진적인 학습 모델을 사용함.작은, 4x4 resolution g의 첫, d의 마지막 레이어를 가져와서 해당 사이즈를 먼저 학습함.activation map은4x4x1024 를 ex.1x1 conv(rgb 로 바꾸기 위함.)를 거쳐 4x4x3으로 변형 후 tanh를 거쳐 -1~1로 변형 후 0~255의 rgb로 매핑latent space 의 4x4x1024를 rgb형태로 바꿔줌으로써 이미지로 변형.descr의 인풋으로 넣어주기 위해선, 위에서 나온 레이어를 4x4x필요채널수 (가령 512)로 변형해주는 from RGB 작업을 거치도록 함.이렇게 한 뒤 더 큰 사이즈의 레이어를 추가하여 기존 레..

    NN/DNN/CNN/RNN - 간단 개념과 사용 용어

    NN/DNN/CNN/RNN - 간단 개념과 사용 용어

    신경망의 업그레이드(?) 순서 : NN -> MLP -> DNN ->CNN,RNN NN (Neural network) (ANN) NN은 인공 신경망의 의미를 가지고 있다. 이는 사람의 뉴런을 묘사하여 만든 알고리즘으로 딥러닝의 기초가 된다. 이론적으로는 일정 임계값을 넘으면 값을 전달하는 구조로 되어있다. 기본 모양은 다음과 같다. input 과 output 사이에 은닉층(hidden layer, 히든레이어)의 구조를 가지고 있다. 히든 레이어를 통과하며 활성화 함수를 통해 weight와 bias값을 찾아 예측을 하는 방법이다. Perceptron (퍼셉트론) NN에서 히든 레이어가 하나인 신경망 구조이다. 이 구조는 AND와 OR의 문제만 풀 수 있고 XOR의 문제를 해결할 수 없다. MLP (Mult..