Ch4. Real-world data representation using tensors
real-word 데이터를 파이토치에 어떻게 나타낼건지에 대한 내용
Height x Weight x Color였던 이미지파일을 permute로 쉽게 C x H x W로 변환 가능. 이때 img와 out은 같은 torch storage를 본다.
4.3 tabular data
one-hot encoding은 다음과 같이 scatter 사용. "모든 행에 대해서, 라벨(target.unsqueeze)을 인덱스로 한 요소를 1.0으로 바꿔라"
unsqueeze는 보다싶이 차원을 하나 올린다. (n) tensor가 (n x 1) tensor가 되는 셈
4.4 시계열 생략..
4.5 Representing Text (텍스트의 표현)
텍스트를 nn이 소화할 수 있는 형태로 바꾸는 과정에 대한 설명. one-hot encoding과 embedding 설명.
NLP분야에서 embedding은 이미 만들어진 걸 가져다 쓰는 경우가 많다.
시계열 작업을 할 때 NLP에서 사용한 아이디어를 가져다 쓰는 경우가 있다. BERT를 추천시스템에 적용한다던지 하는 걸 말하는듯.