NLP 전처리
불용어(stopword)
ref: https://bkshin.tistory.com/entry/NLP-3-불용어Stop-word-제거
분석에 큰 의미가 없는 단어들. a, an, the와 같은 관사나 I, my 같은 대명사들이 해당된다.
* spacy는 nlp객체의 token에서 is_stop(boolean)을 제공해준다.
* nlkt는 불용어 사전을 제공해준다.
import nltk
nltk.download('stopwords')
print('영어 불용어 갯수:',len(