kakaobrain pororo - Natural Language Inference 리뷰

 

NLI에 대하여

Natural language inference

Natural language inference is the task of determining whether a “hypothesis” is true (entailment), false (contradiction), or undetermined (neutral) given a “premise”.

Natural language inference | NLP-progress (nlpprogress.com)

 

두 문장이 주어지고, 의미가 같으면 "Entail"(수반), 다르면 "Contradiction"(모순). 불명확하면 "Neutral"(중립).

자연어 처리 기법이며, 문장의 의미를 탐색하는 어려운 분야이다.

 

더 상세한 내용은 Devsaka님의 블로그 참조

Pororo 공식 가이드

Natural Language Inference — PORORO: Platform Of neuRal mOdels for natuRal language prOcessing 0.3.1 documentation (kakaobrain.github.io)

 

놀랍게도, 한글, 영어, 일본어, 중국어를 지원한다.

 

한글은 KorNLI 데이터셋을 사용한다.

kakaobrain/KorNLUDatasets: KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding (github.com)

 

실행 코드 리뷰

# Natural Language Inference
from pororo import Pororo

nli = Pororo(task="nli", lang="ko")
nli("저는, 그냥 알아내려고 거기 있었어요", "나는 처음부터 그것을 잘 이해했다")
# 결과: 'Contradiction'

nli("나는 나는 새를 보았다", "새도 날고 나도 날았다")
# 결과: 'Neutral'

nli("나는 나는 새를 보았다", "날아가는 새를 보았다")
# 결과: 'Neutral'

nli("나는 질문에 대해 이해했다", "질문에 대한 답을 알았다")
# 결과: 'Entailment'

nli = Pororo(task="nli", lang="en")
nli("A soccer game with multiple males playing.", "Some men are playing a sport.")
# 결과: 'Entailment'

 

좀더 상세한 모델 구현이 궁금해 리뷰. 이후 포스트로 진행 예정.

Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]

 

관련 논문

KorNLI and KorSTS:
New Benchmark Datasets for Korean Natural Language Understanding

 

[논문 뽀개기] KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding | Devsaka’s Blog (catsirup.github.io)

Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]

No. Subject Author Date Views
Notice 2023년 1월 - SQLER의 업데이트 강좌 리스트 코난(김대우) 2023.01.02 2134
53 자동화된 ML, 나도 해보자! | ep4-1. 자동화된ML 결과 해석하기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.11 36
52 자동화된 ML, 나도 해보자! | ep3-2. GUI로 자동화된ML 직접 해보기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.09 36
51 자동화된 ML, 나도 해보자! | ep3-1. GUI로 자동화된ML 직접 해보기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.05 35
50 자동화된 ML, 나도 해보자! | ep2. 애저ML 처음 시작하기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.02 26
49 자동화된 ML, 나도 해보자! | ep1. 자동화된 ML이 왜 필요한가 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.01 36
48 자동화된 ML, 나도 해보자! | ep0. 인트로 | 애저 듣고보는 잡학지식 코난(김대우) 2022.10.31 38
47 마이크로소프트 신텍스(Syntex) file 코난(김대우) 2022.10.27 38
46 텍스트로 3D 오브젝트를 생성 - 구글의 DreamFusion file 코난(김대우) 2022.10.21 295
45 콘텐츠가 데이터 분석을 만났을 때 - #hashTECH Start-Up 코난(김대우) 2022.10.18 40
44 DALL-E 2 - Azure OpenAI 서비스 file 코난(김대우) 2022.10.18 78
43 Ignite 2022의 Codex 데모 - 2022년 10월 버전 file 코난(김대우) 2022.10.16 49
» kakaobrain pororo - Natural Language Inference 리뷰 코난(김대우) 2021.10.29 695
41 (4) AzureML - Azure Machine Learning 모델 배포(Deploy) [1] file 코난(김대우) 2021.10.27 402
40 (3) AzureML - Azure Machine Learning 구성요소 file 코난(김대우) 2021.10.27 261
39 (2) AzureML - Azure Machine Learning 이란 무엇인가? file 코난(김대우) 2021.10.25 272
38 kakaobrain pororo - Automated Essay Scorer 리뷰 코난(김대우) 2021.10.21 253
37 kakobrain에서 발표한 pororo 리뷰 file 코난(김대우) 2021.10.20 900
36 Azure Databricks MLflow를 이용한 MLOps - CI/CD 및 deployment 포함 file 코난(김대우) 2021.10.15 183
35 Azure Databricks MLflow를 이용한 MLOps file 코난(김대우) 2021.10.14 183
34 Azure Databricks - MLflow를 이용한 머신러닝(5) - Model 배포 file 코난(김대우) 2021.10.14 372





XE Login