규정 문서 기반 LLM 응답의 인용 품질 평가 지표
LLM Judge 기반 인용 품질 평가 지표(Citation Precision, Recall, Faithfulness)를 제안하고 GIST 학칙 QA 데이터셋으로 검증
researchllmevaluationrag
Researcher & Developer
devcomfort의 기술 블로그 & 포트폴리오
LLM Judge 기반 인용 품질 평가 지표(Citation Precision, Recall, Faithfulness)를 제안하고 GIST 학칙 QA 데이터셋으로 검증
IEEE CoG 2025 Accept — 자연어 지시 기반 강화학습으로 게임 레벨을 절차적으로 생성하는 방법론.
학부 졸업 연구 (2025년 2월) — One-hot encoding, Entity Embedding, Cat2Vec 세 가지 범주형 인코딩 기법을 Rossmann 데이터셋에서 비교 평가. ARI 기준 임베딩 기법이 One-hot 대비 완벽한 군집화 성능(1.0) 달성.