kakaobrain pororo - Natural Language Inference 리뷰

 

NLI에 대하여

Natural language inference

Natural language inference is the task of determining whether a “hypothesis” is true (entailment), false (contradiction), or undetermined (neutral) given a “premise”.

Natural language inference | NLP-progress (nlpprogress.com)

 

두 문장이 주어지고, 의미가 같으면 "Entail"(수반), 다르면 "Contradiction"(모순). 불명확하면 "Neutral"(중립).

자연어 처리 기법이며, 문장의 의미를 탐색하는 어려운 분야이다.

 

더 상세한 내용은 Devsaka님의 블로그 참조

Pororo 공식 가이드

Natural Language Inference — PORORO: Platform Of neuRal mOdels for natuRal language prOcessing 0.3.1 documentation (kakaobrain.github.io)

 

놀랍게도, 한글, 영어, 일본어, 중국어를 지원한다.

 

한글은 KorNLI 데이터셋을 사용한다.

kakaobrain/KorNLUDatasets: KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding (github.com)

 

실행 코드 리뷰

# Natural Language Inference
from pororo import Pororo

nli = Pororo(task="nli", lang="ko")
nli("저는, 그냥 알아내려고 거기 있었어요", "나는 처음부터 그것을 잘 이해했다")
# 결과: 'Contradiction'

nli("나는 나는 새를 보았다", "새도 날고 나도 날았다")
# 결과: 'Neutral'

nli("나는 나는 새를 보았다", "날아가는 새를 보았다")
# 결과: 'Neutral'

nli("나는 질문에 대해 이해했다", "질문에 대한 답을 알았다")
# 결과: 'Entailment'

nli = Pororo(task="nli", lang="en")
nli("A soccer game with multiple males playing.", "Some men are playing a sport.")
# 결과: 'Entailment'

 

좀더 상세한 모델 구현이 궁금해 리뷰. 이후 포스트로 진행 예정.

Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]

 

관련 논문

KorNLI and KorSTS:
New Benchmark Datasets for Korean Natural Language Understanding

 

[논문 뽀개기] KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding | Devsaka’s Blog (catsirup.github.io)

Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]

No. Subject Author Date Views
Notice SQL강좌: 챗GPT와 함께 배우는 SQL Server 무료 강좌 목차와 소개 (2023년 9월 업데이트) 코난(김대우) 2023.08.18 33947
Notice Python 무료 강좌 - 기초, 중급, 머신러닝(2023년 6월 업데이트) 코난(김대우) 2021.01.01 17162
54 AI, 머신러닝, MLOps – Azure에서 톺아보기! | Developer Digital Meetup Tour 코난(김대우) 2022.11.15 106
53 자동화된 ML, 나도 해보자! | ep4-1. 자동화된ML 결과 해석하기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.11 62
52 자동화된 ML, 나도 해보자! | ep3-2. GUI로 자동화된ML 직접 해보기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.09 73
51 자동화된 ML, 나도 해보자! | ep3-1. GUI로 자동화된ML 직접 해보기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.05 61
50 자동화된 ML, 나도 해보자! | ep2. 애저ML 처음 시작하기 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.02 55
49 자동화된 ML, 나도 해보자! | ep1. 자동화된 ML이 왜 필요한가 | 애저 듣고보는 잡학지식 코난(김대우) 2022.11.01 73
48 자동화된 ML, 나도 해보자! | ep0. 인트로 | 애저 듣고보는 잡학지식 코난(김대우) 2022.10.31 87
47 마이크로소프트 신텍스(Syntex) file 코난(김대우) 2022.10.27 76
46 텍스트로 3D 오브젝트를 생성 - 구글의 DreamFusion file 코난(김대우) 2022.10.21 435
45 콘텐츠가 데이터 분석을 만났을 때 - #hashTECH Start-Up 코난(김대우) 2022.10.18 71
44 DALL-E 2 - Azure OpenAI 서비스 file 코난(김대우) 2022.10.18 133
43 Ignite 2022의 Codex 데모 - 2022년 10월 버전 file 코난(김대우) 2022.10.16 88
» kakaobrain pororo - Natural Language Inference 리뷰 코난(김대우) 2021.10.29 825
41 (4) AzureML - Azure Machine Learning 모델 배포(Deploy) [1] file 코난(김대우) 2021.10.27 490
40 (3) AzureML - Azure Machine Learning 구성요소 file 코난(김대우) 2021.10.27 314
39 (2) AzureML - Azure Machine Learning 이란 무엇인가? file 코난(김대우) 2021.10.25 374
38 kakaobrain pororo - Automated Essay Scorer 리뷰 코난(김대우) 2021.10.21 330
37 kakobrain에서 발표한 pororo 리뷰 file 코난(김대우) 2021.10.20 1273
36 Azure Databricks MLflow를 이용한 MLOps - CI/CD 및 deployment 포함 file 코난(김대우) 2021.10.15 272
35 Azure Databricks MLflow를 이용한 MLOps file 코난(김대우) 2021.10.14 310





XE Login