본문 바로가기
ML&AI

Query Answering 방법론

by 혜룐 2024. 3. 23.

Textual Question Answering : Text 에 기반한 Question Answering

  • 정보 검색 : 질문에 대한 정답이 있을 것 같은 문서 찾기 (IR-based QA)
  • 정보 추출 : 찾은 문서들 내에서 정답 찾기

QA처리과정

  • Question processing 
    • query formulation
    • answer type detection
      • words/임베딩
      • pos for each word
      • question headword
  • document and passage retreival
    • 관련성이 있을 수 있는 하위집합에 focus한다. (IRQA의 한계)
    • Information Retreival정보추출
      • 쿼리와 문서의 유사도로 순위를 매김
    • document retrieval
      • answer extraction은 주로 문서가 아닌 문단 별로 구한다.
      • 즉 문단들의 순위를 매긴다.
        • 아래 정보를 활용하여 문단 순위매김
          • number of entities of correct type(=answer type)
          • number of question keywords
          • logest exact sequence of keywords in passage
          • rank of document
          • ngram overlap
    • anwer extract
      • 주어진 문단에대한 정답을 추출한다.

QA시스템에서의 질의를 6가지로 분류

  • Factoid Answering Question
    • 답변이 명확한 semantic type entity, 단답형이 가능한 질문
    • factoid question에 대한 대답은 간단한 사실이다.
    •  
    • 절차
      • 질문에 대한 정답을 포함할거 같은 '짧은 텍스트 세그먼트'들을 찾는다.
      • 찾은 세그먼트들을 적절하게 리포맷한다.
      • 리포맷한 결과를 사용자에게 보여준다.
  • List type question
    • factoid와 비슷하지만, 답변이 Names entities로 나옴
  • confirmation question
    • 확인하는 질문인지
  • Casual Question
    • 이유나 설명들을 알고 싶을때
  • Hypothetical Questions
    • 예상질문을 추출
  • Complex Question
    • 여러가지 문서를 읽고, 종합적으로 답을 도출해 내야하는 질문