목록Python (96)
브이로그
1. 자연어 특성 2. 임베딩 구축 방법 3. 텍스트 유사도 4. 유사도 측정 실습
Python
2024. 6. 26. 01:14
1. 문제 정의 2. 데이터 수집 및 분석 3. 데이터 전처리 4. 서브워드 토큰화 5. 정제 6. 정규화 7. 한국어 데이터 전처리 8. 자연어 전처리 실습 https://arxiv.org/abs/1508.0790 Neural Machine Translation of Rare Words with Subword UnitsNeural machine translation (NMT) models typically operate with a fixed vocabulary, but translation is an open-vocabulary problem. Previous work addresses the translation of out-of-vocabulary words by backing off to a ..
Python
2024. 6. 25. 02:12