딥러닝을 이용한 영어-프랑스어 기계 번역 모델 구현
- 제작 기간: 2022.03.17 ~ 2022.03.22
- 개선 기간: 2023.03.02 ~
├── Section4
│ ├── en_fr_tokenizers ﹒﹒﹒ 영어, 프랑스어 Tokenizer
│ └── Project_Section4.ipynb ﹒﹒﹒ 원본 코드
├── model
│ ├── transformer.py ﹒﹒﹒ Transformer 모델
├── data_loader.py ﹒﹒﹒ 데이터 전처리
├── evaluate.py ﹒﹒﹒ 테스트 데이터셋 성능 평가
├── train.py ﹒﹒﹒ 모델 훈련 및 저장
├── translate.py ﹒﹒﹒ 입력 받은 문장의 번역 결과 출력
├── translator.py ﹒﹒﹒ 추론 모델 생성 및 저장
- 데이터 업데이트
- ipynb에서 py 파일로 수정
- 평가지표로 BLEU Score 사용
- Post-Layer Normalization 에서 Pre-Layer Normalization 방식으로 수정
- 에러 해결
- French - English
- 데이터셋 크기: (208906, 2)
- 데이터 출처