Textual Question Answering : Text 에 기반한 Question Answering
- 정보 검색 : 질문에 대한 정답이 있을 것 같은 문서 찾기 (IR-based QA)
- 정보 추출 : 찾은 문서들 내에서 정답 찾기
QA처리과정
- Question processing
- query formulation
- answer type detection
- words/임베딩
- pos for each word
- question headword
- document and passage retreival
- 관련성이 있을 수 있는 하위집합에 focus한다. (IRQA의 한계)
- Information Retreival정보추출
- 쿼리와 문서의 유사도로 순위를 매김
- document retrieval
- answer extraction은 주로 문서가 아닌 문단 별로 구한다.
- 즉 문단들의 순위를 매긴다.
- 아래 정보를 활용하여 문단 순위매김
- number of entities of correct type(=answer type)
- number of question keywords
- logest exact sequence of keywords in passage
- rank of document
- ngram overlap
- 아래 정보를 활용하여 문단 순위매김
- anwer extract
- 주어진 문단에대한 정답을 추출한다.
QA시스템에서의 질의를 6가지로 분류
- Factoid Answering Question
- 답변이 명확한 semantic type entity, 단답형이 가능한 질문
- factoid question에 대한 대답은 간단한 사실이다.
- 절차
- 질문에 대한 정답을 포함할거 같은 '짧은 텍스트 세그먼트'들을 찾는다.
- 찾은 세그먼트들을 적절하게 리포맷한다.
- 리포맷한 결과를 사용자에게 보여준다.
- List type question
- factoid와 비슷하지만, 답변이 Names entities로 나옴
- confirmation question
- 확인하는 질문인지
- Casual Question
- 이유나 설명들을 알고 싶을때
- Hypothetical Questions
- 예상질문을 추출
- Complex Question
- 여러가지 문서를 읽고, 종합적으로 답을 도출해 내야하는 질문
'ML&AI' 카테고리의 다른 글
AI 사용 환경에서 데이터를 보호하는 법을 주제로, Copilot for Microsoft 365를 위한 Microsoft Purview제품 소개 (0) | 2024.03.27 |
---|---|
The Claude 3 Model Family: Opus, Sonnet, Haiku (0) | 2024.03.25 |
효과적으로 문장을 분리하는 방법론 (0) | 2024.03.23 |
RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation (0) | 2024.03.23 |
RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval (0) | 2024.03.23 |