참여사 ∙ AI 특화 기술 보유그룹
고품질 데이터부터 LLM 평가까지, 고난도 설계 기반 AI 학습 데이터 구축 전문 기업
AI Consulting
DATA
Gen AI
Evaluation
비공개
LLM이 정제된 데이터에서 답변의 정확한 위치를 찾도록 돕는 MRC QA 데이터 구축
HWP 및 PDF 형태의 문서에서 텍스트를 추출하고 주제 층위별로 구조화
LLM이 생성한 답변 데이터를 평가, 수정한 후 재학습시켜 답변의 정확성 및 자연스러움을 높임
고객사·경쟁사 정보 수집 및 사실 여부 판단 실시
공신력 있는 출처에서 획득한 데이터를 동일한 형식으로 가공해 신뢰성/활용성 높은 지식 데이터 구축
QA형태로 구성 후 패러프레이즈하여 다양한 한국어 질문에 대한 대응 능력 확대
LLM 평가를 위한 테스트 데이터셋 구축
QA, 상식 추론, 환각 방지, 어휘 의미 분석, 감성 분석 등의 테스크가 반영된 9가지의 평가 데이터셋을 바탕으로 구축
해외 데이터셋 벤치마킹: TruthfulQA, BooIQ, HellaSwag, Winogrande, WiC, SentiNeg, ARC, MMLU, COPA
다양한 카테고리, 주제를 활용하여 데이터셋 구성
고객 경험 향상을 위한 챗봇 데이터 윤문
일관된 고객 경험을 제공, 콘텐츠 톤 앤 매너 통일
안내 및 콘텐츠 등 고객의 니즈를 고려한 정보 구조화를 통해 사용자 맞춤형 챗봇 시나리오 제안
고객 관점 언어 반영
정상적으로 접수되었습니다