BLEU
일반적인 precision이나 recall을 계산하면 Seq2Seq에서는 모든 지표가 0에 가까울 것이다. 왜냐하면 step별로 비교하면 대부분 일치하지 않을 확률이 매우 높기 때문이다. 즉, 아래처럼 굉장히 유사한 문장의 지표가 0에 가깝게 나올 수도 있다.
그래서 이러한 맥락을 지표에 반영할 필요가 있다.
Precision, Recall
** Precision(정밀도) **
* 예측한 결과에 대해서 corrected words가 몇개인지 나타낸다.
* 예측한