본문 바로가기

전체 글184

Generative Agents: Interactive Simulacra of Human Behavior https://arxiv.org/pdf/2304.03442게임과 같은 상호작용 환경에서 믿을 만한 인간 행동을 시뮬레이션하는 생성 에이전트의 개발과 평가에 중점을 둔 논문이다.자기인식(자신을 소개하거나 일상 일정을 설명하는 질문에 얼마나 잘 응답하는지), 기억(특정 사건이나 대화를 기억에서 검색하여 적절히 응답하는 능력), 계획(미래 행동을 계획하는 능력), 반응(예상치 못한 사건에 적절히 반응하는 능력), 반성(하루를 반성하고 미래 행동을 개선할 수 있는 능력)생성 에이전트 아키텍처:이 아키텍처는 큰 언어 모델을 사용하여 관련 기억을 저장, 합성 및 적용하여 믿을 만한 행동을 생성하도록 설계되어있다.행동의 틀을 제공하는 것을 목표로 한다.다른 에이전트와 상호작용하고 환경 변화에 반응할 수 있는 틀이다... 2024. 6. 3.
topK, temperature scaling, topP topKtop-k-sample은 모델이 예측한 다음 토큰 확률 분포에서 확률값이 가장 높은 K깨 토큰 가운데 하나를 다음 토큰으로 선택하는 기법이다. K개 안에 있는 토큰이라면, 확률값이 낮은 케이스도 다음 토큰으로 추출될 수 있다. 띠라서 topK 샘플링은 매 수행때마다 생성결과가 달라진다. topK=1로 하는 경우 그리디서치와 똑같은 효과를 나타낸다. 가장 높은 1개의 후보만 남긴 후 여기에서 하나는 뽑는 것이기 때문에 매 순간 최선을 선택하는 것과 동일하다. 그리디서치, 빔서치는 https://rhr0916.tistory.com/276 참고temperature scaling모델의 다음 토큰 확률 분포를 대소 관계의 역전 없이 분포의 모양만을 바꿔서 문장을 다양하게 생성하는 기법이다. 모델의 출력 로.. 2024. 5. 2.
topK, temperature scaling, topP topKtop-k-sample은 모델이 예측한 다음 토큰 확률 분포에서 확률값이 가장 높은 K깨 토큰 가운데 하나를 다음 토큰으로 선택하는 기법이다. K개 안에 있는 토큰이라면, 확률값이 낮은 케이스도 다음 토큰으로 추출될 수 있다. 띠라서 topK 샘플링은 매 수행때마다 생성결과가 달라진다. topK=1로 하는 경우 그리디서치와 똑같은 효과를 나타낸다. 가장 높은 1개의 후보만 남긴 후 여기에서 하나는 뽑는 것이기 때문에 매 순간 최선을 선택하는 것과 동일하다.temperature scaling모델의 다음 토큰 확률 분포를 대소 관계의 역전 없이 분포의 모양만을 바꿔서 문장을 다양하게 생성하는 기법이다. 모델의 출력 로짓(소프트맥스 변환 전 벡터)의 모든 요솟값을 temperature로 나누는 방식으로.. 2024. 5. 1.
Greedy 그리디서치 , beam 빔서치 언어모델은 컨텍스트(=토큰시퀀스)를 입력받아, 다음 토큰이 나타날 확률을 출력으로 반환한다. 즉 모델의 출력 확률 분포로부터 다음 토큰을 반복해서 선택하는 과정이 바로 문장생성 태스크다. 문제는 특정 컨텍스트 다음에 올 토큰으로 무수히 많은 경우의 수가 존재한다. 이론적으로는 다음 단어를 하나 선택해야 할 때 어휘 집합 크기만큼의 경우의 수가 생길 수 있다. 이렇게 반복적으로 다음 토큰을 생성할 경우 무수히 많은 가짓수가 파생되며 모든 경우의 수를 계산해 보는것는것은 사실상 불가능 하다.Greedy search model.generate파라미터의 do_sample=False를 주므로써 확률값이 높은 단어를 다음 단어로 결정되도록하면 그리디서치를 수행하게 된다. 그리디서치는 매 단계에서 가장 높은 확률을 .. 2024. 5. 1.