본문 바로가기

나름분류해서써보기187

Are Large Language Models All You Need for Task-Oriented Dialogue? 올한해를 회고하며 Are Large Language Models All You Need for Task-Oriented Dialogue https://arxiv.org/pdf/2304.06556v2 논문을 읽었다.불과 몇년 전만 해도 우리는 BERT 기반의 인텐트 분류기와 NER을 조합해 챗봇을 만들었다. 디자이너들은 수많은 예상 질문을 작성하고, 각각의 인텐트를 정교하게 설계했다. 마치 퍼즐을 맞추듯 하나하나 규칙을 정의하고 폴백을 처리하는 방식이었다. 이당시 내가 얻은 경험은 ner을 글로벌(?)하게 작업했더니 맥락을 기반한 태깅은 잘 되나 오태깅은 어쩔수 없었다. 특히 중의적인 단어들.. 그래서 도메인별 ner을 만들어야 겠다는 생각을 했다.작년초에 생성형모델을 활용해 펑션콜기반의 챗봇을 poc을 .. 2024. 12. 8.

Advances in AI for Protein Structure Prediction: Implications for Cancer Drug Discovery and Development-BioNeMo 생명과학 AI 플랫폼, AlphaFold 2는 Google DeepMind에서 개발한 AI 모델(단백질 구조를 예측) 생명과학 관련된 AI기술AlphaFold: 단백질 구조 예측을 위한 AI 모델. 단백질의 3D 구조를 정확히 예측하는 기술로, DeepMind에서 개발.BioNeMo: 단백질 서열, 구조, 기능 분석과 약물 설계를 돕는 AI 플랫폼. NVIDIA가 개발하고 다양한 연구 및 산업에서 활용.Evozyne: AI를 활용해 단백질을 설계 및 엔지니어링하는 생명공학 회사. BioNeMo와 같은 플랫폼을 사용하여 맞춤형 단백질을 설계. Evozyne은 AI와 단백질 엔지니어링을 결합하여 새로운 기능을 가진 단백질을 설계하는 생명공학 회사입니다. 특히 BioNeMo 플랫폼과 같은 AI 기술을 사용하여 단백질의 진화를 가속화하고, 특정 질병 치료를 위한 효소나 단백질을 설계하는 데 주력합니다.핵심 기술:Evozyne는.. 2024. 11. 23.

웹 기반 코퍼스 분석 도구 / 유사도 기반의 저자판별 도구의 기능 http://corpus.korea.ac.kr단어빈도빈도는 관심의 정도를 반영하는 지표공기어 분석대상어랑 같은 문맥에서 함께 나타나는 단어문맥 같은 문장에 나타나는 단어를 문맥으로 본다.윈도우사이즈연관성:상호정보, TfIdfT점수같은 문장에서 두 단어가 우연히 나타날 빈도보다 실제로 함게 나타난 빈도가 높을수록 강한 공기관계가 성립한다.관련어대상어와 의미적으로 관련있는 단어동의어, 반의어, 상/하위어, 유사어등 전처리과정문자 정규화호환 문자를 대표형으로 변환문장, 문단 구분문장은 , 문단 태그로 구분한자 한글 변환(변기)한자어-한글 사전, 한자-한글 테이블, 두음법칙, 최장일치분석법유니코드 한자-한글 자동 변환 연구 및 구현형태소분석 대체어 및 외래어 이형태 검출 --> 소멸된 단어가 후보가.. 2024. 11. 12.

텍스트마이닝 1. 정확률 (Accuracy)정확률은 전체 데이터 중에서 올바르게 예측한 비율을 나타내는 지표입니다. 즉, 모델이 얼마나 정확하게 예측했는지를 평가합니다.정의:정확률 (Accuracy)=올바르게 예측한 샘플 수전체 샘플 수=TP+TNTP+TN+FP+FN\text{정확률 (Accuracy)} = \frac{\text{올바르게 예측한 샘플 수}}{\text{전체 샘플 수}} = \frac{TP + TN}{TP + TN + FP + FN}정확률 (Accuracy)=전체 샘플 수올바르게 예측한 샘플 수=TP+TN+FP+FNTP+TNTP (True Positive): 실제로 긍정인 데이터를 긍정으로 예측한 경우TN (True Negative): 실제로 부정인 데이터를 부정으로 예측한 경우FP (False P.. 2024. 10. 20.

이전 1 ··· 3 4 5 6 7 8 9 ··· 47 다음

티스토리툴바