sunghogigio
  • Home
  • About
Sign in Subscribe

NLP

Bag-of-Words

Bag-of-Words 딥러닝 이전에 단어를 숫자로 나타내는 기법. Bag-of-Words Representation 1. Constructing the vocabulary conatining unique words. 여러 문장에 걸쳐 중복되게 사용된 단어라도 Vocabulary에서는 한번만 표현된다. 2. Encoding unique words to one-hot vectors. Vocabulary에 존재하는 단어들을 일종의 categorical data로 볼 수 있어서 one-hot vecotr로 표기해보는 것. 가령, Vocabulary에 8개의 단어가 있다면
Sungho Park 06 Sep 2021

NLP 개요

NLP(Natural language processing) NLU와 NLG로 나뉜다. * NLU(Natural language understanding): 언어에서 의도한 바를 이해하는 것 * NLG(Natural language generation): machine이 nl을 어떻게 생성할지 가르치는 영역. * Major conference: ACL, EMNLP, NAACL Low-level parsing 의미 추출을 위한 low level task들은 다음과 같다. Toeknization ref: https://bkshin.tistory.com/entry/NLP-2-텍스트-토큰화Text-Tokenization * Token:
Sungho Park 06 Sep 2021

Subscribe to sunghogigio

  • Sign up
sunghogigio © 2025. Powered by Ghost