본문 바로가기

ML6

RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval 대부분의 기존 방식은 검색 말뭉치에서 짧게 연속된 청크만 검색하므로 전체 문서 컨텍스트에 대한 전체적인 이해가 제한된다. 예를 들어 상위 k개의 검색된 짧은 연속 텍스트는 질문에 답하기에 충분한 컨텍스담지 못한다. 인접한 청크만 사용한 경우, 거리가 먼 의존성이 있는 청크는 후보군에 포함되지 못할 수 있다. 모델들은 장거리 컨텍스트를 활용하지 못하며, 특히 관련 정보가 긴 컨텍스트 내에 포함되어 있을 때 컨텍스트 길이가 증가함에 따라 성능이 감소하는 경향이 있다. 또한, 긴 컨텍스트의 사용은 비용이 많이 들고 느리다는 문제가 있다. 텍스트 청크를 재귀적으로 임베딩, 클러스터링, 요약하는 새로운 접근 방식을 도입하여 아래에서 위로 다양한 수준의 요약 트리를 구축한다. 추론 시 RAPTOR 모델은 이 트리에.. 2024. 3. 23.
Query Answering 방법론 Textual Question Answering : Text 에 기반한 Question Answering 정보 검색 : 질문에 대한 정답이 있을 것 같은 문서 찾기 (IR-based QA) 정보 추출 : 찾은 문서들 내에서 정답 찾기 QA처리과정 Question processing query formulation answer type detection words/임베딩 pos for each word question headword document and passage retreival 관련성이 있을 수 있는 하위집합에 focus한다. (IRQA의 한계) Information Retreival정보추출 쿼리와 문서의 유사도로 순위를 매김 document retrieval answer extraction은 .. 2024. 3. 23.