Recent Posts
Recent Comments
목록rag (1)
Writing creates memory
RAG 답변 성능 평가
RAG(Retrieval-Augmented Generation)는 검색(Retrieval)과 생성(Generation)의 두 단계를 통해 답변을 생성하는 구조입니다.따라서 RAG의 성능을 평가하려면 단순한 정답 비교만으로는 부족하며, 생성된 답변의 정확성(Correctness)과 관련성(Relevance)을 중심으로 정교하게 평가할 필요가 있습니다. ✅ 1. RAG 평가의 핵심 기준정확성 (Correctness): 사실 기반의 정확한 정보인가관련성 (Relevance): 질문 또는 문맥과 얼마나 잘 맞는가 ✅ 2. 평가 방식 분류Reference 기반정답(ground truth)이 있는 경우. ROUGE, BLEU, 편집거리 등 사용Context 기반주어진 문맥에 대한 적절성 평가. LLM-as-a-J..
LLM
2025. 6. 22. 22:55