boostcamp

Extraction-Based MRC

Extraction-Based MRC 질문의 답변이 항상 주어진 지문(context)내에 span으로 존재. 답변을 생성하지 않고 답변을 context에서 찾는 것으로 문제를 좁힐 수 있다. e.g.,) SQuAD, KorQuAD, NewsQA, Natural Questions ![](/assets/images/Extraction-Based MRC/722a0e0b-0d30-4a1b-9385-39bff9ad45ab-image.png) 이러한 dataset들은 HuggingFace Datsets에서 다운 받는게 제일 편하다. Metric Exact Match(EM) Score 예측값과 정답이
Sungho Park

Language model Benchmark 간단 정리

Language modeling Seq2Seq task다. 주어진 문맥을 활용해 다음 단어를 예측하는 task. ![](/assets/images/Language model Benchmark 간단 정리/c4574267-c36a-47a2-8735-213136b0523f-image.png) 특정 시점의 문장에 대한 다음 단어가 나타날 확률을 예측하는 task로도 생각할 수 있다. RNNs ![](/assets/images/Language model Benchmark 간단 정리/eade94db-783b-4d14-97ce-ba671fdb5f24-image.png) Sequence의 순서대로 model에 sequence를 입력한다. 이전 hidden
Sungho Park

AI & Ethics

Bias 미국 Northpointe社의 재범가능성(recidivism)을 예측하는 COMPAS는 아래와 같이 인종, 성별에 관해서 편향된 추측을 하는 경향과 법률적 근거가 모호해 폐기된 전례가 있다. ![](/assets/images/AI & Ethics/12702dce-9ede-49d5-86ba-785eb013d5a4-image.png) 개인적인 생각으로 COMPAS는 법적 설득력의 부족과 잘못된 모델 설계의 문제로 인해 발생된 Bias 이슈라고 생각된다. 특정 성별, 인종, 종교에 편향되어
Sungho Park

Full stack ML Engineer

ML Engineer ML/DL을 이해, 연구하고 Product을 만드는 Engineer. ![](/assets/images/Full stack ML Engineer/eb9eb9c1-bc28-40c0-ac2f-ac3c54855c8f-image.png) Researcher와 Engineer의 사이에서 모호한 위치에 있다. 발전속도가 워낙 빨라서 연구와 동시에 Product에 적용할 사례가 많기 때문이다. Full stack Engineer ![](/assets/images/Full stack ML Engineer/cc790f50-9fe5-4605-9946-f9fc4af539f5-image.png) Front-end, Back-end를 모두 개발 가능한 Engineer.
Sungho Park

AI 저작권법

개인적인 연구가 아니라 공개를 목적으로 한 프로젝트에서는 데이터의 저작권과 라이센스를 중요하게 다뤄야한다. ![](/assets/images/AI 저작권법/8c16cf0c-b974-4f93-978c-a26f4f41a926-image.png) 학계에서도 데이터 저작권, 라이센스가 제대로 지켜졌는지 평가하고 있다. https://2021.aclweb.org/ethics/Ethics-review-questions/ 저작권 보호 수준 창작성이 인정받는 수준에서는 저작권이 보호된다. * 판례는 창작성이 인정되지 않아 저작권 보호가 되지 않기 때문에 판례
Sungho Park