Bag-of-Words
Bag-of-Words
딥러닝 이전에 단어를 숫자로 나타내는 기법.
Bag-of-Words Representation
1. Constructing the vocabulary conatining unique words.
여러 문장에 걸쳐 중복되게 사용된 단어라도 Vocabulary에서는 한번만 표현된다.
2. Encoding unique words to one-hot vectors.
Vocabulary에 존재하는 단어들을 일종의 categorical data로 볼 수 있어서 one-hot vecotr로 표기해보는 것.
가령, Vocabulary에 8개의 단어가 있다면