kakaobrain pororo - Natural Language Inference 리뷰
NLI에 대하여
Natural language inference
Natural language inference is the task of determining whether a “hypothesis” is true (entailment), false (contradiction), or undetermined (neutral) given a “premise”.
두 문장이 주어지고, 의미가 같으면 "Entail"(수반), 다르면 "Contradiction"(모순). 불명확하면 "Neutral"(중립).
자연어 처리 기법이며, 문장의 의미를 탐색하는 어려운 분야이다.
더 상세한 내용은 Devsaka님의 블로그 참조
Pororo 공식 가이드
놀랍게도, 한글, 영어, 일본어, 중국어를 지원한다.
한글은 KorNLI 데이터셋을 사용한다.
실행 코드 리뷰
# Natural Language Inference from pororo import Pororo nli = Pororo(task="nli", lang="ko") nli("저는, 그냥 알아내려고 거기 있었어요", "나는 처음부터 그것을 잘 이해했다") # 결과: 'Contradiction' nli("나는 나는 새를 보았다", "새도 날고 나도 날았다") # 결과: 'Neutral' nli("나는 나는 새를 보았다", "날아가는 새를 보았다") # 결과: 'Neutral' nli("나는 질문에 대해 이해했다", "질문에 대한 답을 알았다") # 결과: 'Entailment' nli = Pororo(task="nli", lang="en") nli("A soccer game with multiple males playing.", "Some men are playing a sport.") # 결과: 'Entailment'
좀더 상세한 모델 구현이 궁금해 리뷰. 이후 포스트로 진행 예정.
Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]
관련 논문
KorNLI and KorSTS:
New Benchmark Datasets for Korean Natural Language Understanding
Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]