1. 프로젝트 개요

1.1 프로젝트 주제

본 프로젝트는 복수의 문장에 대한 유사도를 선형적 수치로 제시하는 STS(Semantic Text Similarity) NLP Task이다.

본 프로젝트에서는 두 개의 문장을 입력하고, 이러한 문장쌍이 얼마나 의미적으로 서로 유사한지(0~5점)를 측정하는 모델을 구축한다.

1-2. 팀 구성 및 역할

팀 명: 일석이조 (NLP 12조)

김별희 : EDA, Data Augmentation, Metric Learning

김진호: Data Augmentation, Tokenizer, Ensemble

이원재: 템플릿 pl버전으로 수정하기, Sentence-Transformer 모델 튜닝

이정아: EDA, Data Augmentation, k-fold Cross Validation, 실험

최석훈: EDA, 템플릿에 pl, wandb 기능 이식하기, Predict Check, 실험

협업 Tools : Slack, Notion, WandB, Github

1-3. 진행 기간 / Github

1-4. 데이터셋 및 평가 방법