본문 바로가기

전체 글155

RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation RAT는 초기 CoT와 작업 프롬프트를 사용하여 유용한 정보를 검색하고, 현재 및 과거 CoT에 기반한 정보로 현재 사고 단계를 수정하는 점진적 접근 방식을 사용한다.. 이 전략은 복잡한 장기 문제 해결 과정에서 인간의 추론 과정이랑 비슷하다고 한다. RAG는 문서와 질문 사이의 유사성을 코사인 유사도를 통해 측정하고, 상위 𝑘개 문서를 LLMs의 프롬프트로 피드하여 정확하고 사실적인 컨텍스트를 제공한다. 그러나 복잡한 추론 작업에서는 효과적인 검색 쿼리로 변환하기 어려울 수 있다. RAG는 한 번에 모든 관련 정보를 검색하지만, 이는 후속 추론 및 생성 단계에서 필요한 "사실"이나 정보를 예측하기 어렵다. COT과정을 거친 답변이, 지나치게 디테일하거나 장황한 답변을 보다 구조화 하여 내려줄수도 있어 .. 2024. 3. 23.
RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval 대부분의 기존 방식은 검색 말뭉치에서 짧게 연속된 청크만 검색하므로 전체 문서 컨텍스트에 대한 전체적인 이해가 제한된다. 예를 들어 상위 k개의 검색된 짧은 연속 텍스트는 질문에 답하기에 충분한 컨텍스담지 못한다. 인접한 청크만 사용한 경우, 거리가 먼 의존성이 있는 청크는 후보군에 포함되지 못할 수 있다. 모델들은 장거리 컨텍스트를 활용하지 못하며, 특히 관련 정보가 긴 컨텍스트 내에 포함되어 있을 때 컨텍스트 길이가 증가함에 따라 성능이 감소하는 경향이 있다. 또한, 긴 컨텍스트의 사용은 비용이 많이 들고 느리다는 문제가 있다. 텍스트 청크를 재귀적으로 임베딩, 클러스터링, 요약하는 새로운 접근 방식을 도입하여 아래에서 위로 다양한 수준의 요약 트리를 구축한다. 추론 시 RAPTOR 모델은 이 트리에.. 2024. 3. 23.
Query Answering 방법론 Textual Question Answering : Text 에 기반한 Question Answering 정보 검색 : 질문에 대한 정답이 있을 것 같은 문서 찾기 (IR-based QA) 정보 추출 : 찾은 문서들 내에서 정답 찾기 QA처리과정 Question processing query formulation answer type detection words/임베딩 pos for each word question headword document and passage retreival 관련성이 있을 수 있는 하위집합에 focus한다. (IRQA의 한계) Information Retreival정보추출 쿼리와 문서의 유사도로 순위를 매김 document retrieval answer extraction은 .. 2024. 3. 23.
프로세스점유율 , cpuinfo , memory 프로세스점유율 ansible -i release server-inventory-name -m shell -a "ps -C java -o user,pid,pcpu,pmem,vsize,size,etime,comm" -u deploy cpuInfo ansible -i release server-inventory-name -m shell -a "grep -c processor /proc/cpuinfo" -u deploy mem ansible -i release server-inventory-name -m shell -a "free -h" -u deploy sudo lsof -p pid 주면 pid에 리스닝정보를 볼 수 있음 2020. 2. 25.