머신러닝 & AI 개발자 Tip & 강좌 게시판

Data Scientist와 개발자를 위한 머신러닝, AI 등 개발 Tip과 강좌 게시판 입니다. 일반적인 머신러닝은 물론 딥러닝(Tensorflow, Keras, PyTorch 등), 인공지능 관련 업무를 진행하면서 얻은 Tip이나 강좌, 새로운 소식을 적어 주시면 다른 개발자 분들에게 큰 도움이 됩니다.

 

kakaobrain pororo - Natural Language Inference 리뷰

 

NLI에 대하여

Natural language inference

Natural language inference is the task of determining whether a “hypothesis” is true (entailment), false (contradiction), or undetermined (neutral) given a “premise”.

Natural language inference | NLP-progress (nlpprogress.com)

 

두 문장이 주어지고, 의미가 같으면 "Entail"(수반), 다르면 "Contradiction"(모순). 불명확하면 "Neutral"(중립).

자연어 처리 기법이며, 문장의 의미를 탐색하는 어려운 분야이다.

 

더 상세한 내용은 Devsaka님의 블로그 참조

Pororo 공식 가이드

Natural Language Inference — PORORO: Platform Of neuRal mOdels for natuRal language prOcessing 0.3.1 documentation (kakaobrain.github.io)

 

놀랍게도, 한글, 영어, 일본어, 중국어를 지원한다.

 

한글은 KorNLI 데이터셋을 사용한다.

kakaobrain/KorNLUDatasets: KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding (github.com)

 

실행 코드 리뷰

# Natural Language Inference
from pororo import Pororo

nli = Pororo(task="nli", lang="ko")
nli("저는, 그냥 알아내려고 거기 있었어요", "나는 처음부터 그것을 잘 이해했다")
# 결과: 'Contradiction'

nli("나는 나는 새를 보았다", "새도 날고 나도 날았다")
# 결과: 'Neutral'

nli("나는 나는 새를 보았다", "날아가는 새를 보았다")
# 결과: 'Neutral'

nli("나는 질문에 대해 이해했다", "질문에 대한 답을 알았다")
# 결과: 'Entailment'

nli = Pororo(task="nli", lang="en")
nli("A soccer game with multiple males playing.", "Some men are playing a sport.")
# 결과: 'Entailment'

 

좀더 상세한 모델 구현이 궁금해 리뷰. 이후 포스트로 진행 예정.

Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]

 

관련 논문

KorNLI and KorSTS:
New Benchmark Datasets for Korean Natural Language Understanding

 

[논문 뽀개기] KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding | Devsaka’s Blog (catsirup.github.io)

Fine-tuning BERT for Natural Language Inference - Portfolio_Page[Hamed Helali]

No. Subject Author Date Views
» kakaobrain pororo - Natural Language Inference 리뷰 코난(김대우) 2021.10.29 540
41 (4) AzureML - Azure Machine Learning 모델 배포(Deploy) [1] file 코난(김대우) 2021.10.27 301
40 (3) AzureML - Azure Machine Learning 구성요소 file 코난(김대우) 2021.10.27 183
39 (2) AzureML - Azure Machine Learning 이란 무엇인가? file 코난(김대우) 2021.10.25 204
38 kakaobrain pororo - Automated Essay Scorer 리뷰 코난(김대우) 2021.10.21 183
37 kakobrain에서 발표한 pororo 리뷰 file 코난(김대우) 2021.10.20 435
36 Azure Databricks MLflow를 이용한 MLOps - CI/CD 및 deployment 포함 file 코난(김대우) 2021.10.15 109
35 Azure Databricks MLflow를 이용한 MLOps file 코난(김대우) 2021.10.14 124
34 Azure Databricks - MLflow를 이용한 머신러닝(5) - Model 배포 file 코난(김대우) 2021.10.14 210
33 Azure Databricks - MLflow를 이용한 머신러닝(4) - Model Registry file 코난(김대우) 2021.10.12 127
32 Azure Databricks - MLflow를 이용한 머신러닝(3) - Project file 코난(김대우) 2021.10.08 104
31 Azure Databricks - MLflow를 이용한 머신러닝(2) - Tracking file 코난(김대우) 2021.10.08 130
30 Azure Databricks - MLflow를 이용한 머신러닝(1) file 코난(김대우) 2021.10.08 145
29 Azure Databricks - Spark에서 머신러닝 분산 처리 file 코난(김대우) 2021.10.07 67
28 PySpark cheat sheet 자료 - RDD, 데이터 처리 file 코난(김대우) 2021.10.01 64
27 PySpark을 이용한 머신러닝 튜토리얼 예제 코난(김대우) 2021.10.01 374
26 Form Recognizer로 문서에서 표 데이터 추출 file 코난(김대우) 2021.01.21 272
25 MLaaS - (1) 12가지의 머신러닝을 먼저 도입한 기업들의 고민 file 코난(김대우) 2021.01.15 516
24 Python 머신러닝 강좌 - 15. Matplotlib으로 데이터 시각화(visualization) file 코난(김대우) 2021.01.09 410
23 Python 머신러닝 강좌 - 14. NumPy와 Pandas 코난(김대우) 2021.01.09 356





XE Login