본문 바로가기
카테고리 없음

Deep Learning with PyTorch - Ch4

by sun__ 2022. 3. 18.

Ch4. Real-world data representation using tensors

real-word 데이터를 파이토치에 어떻게 나타낼건지에 대한 내용

 

Height x Weight x Color였던 이미지파일을 permute로 쉽게 C x H x W로 변환 가능. 이때 img와 out은 같은 torch storage를 본다. 

 

 

4.3 tabular data

one-hot encoding은 다음과 같이 scatter 사용. "모든 행에 대해서, 라벨(target.unsqueeze)을 인덱스로 한 요소를 1.0으로 바꿔라"

unsqueeze는 보다싶이 차원을 하나 올린다. (n) tensor가 (n x 1) tensor가 되는 셈

 

4.4 시계열 생략..

 

4.5 Representing Text (텍스트의 표현)

텍스트를 nn이 소화할 수 있는 형태로 바꾸는 과정에 대한 설명. one-hot encoding과 embedding 설명.

 

NLP분야에서 embedding은 이미 만들어진 걸 가져다 쓰는 경우가 많다.

 

시계열 작업을 할 때 NLP에서 사용한 아이디어를 가져다 쓰는 경우가 있다. BERT를 추천시스템에 적용한다던지 하는 걸 말하는듯.