/yans2021

System for finding and clustering examples by word sense, presented at YANS2021

Primary LanguagePython

文脈化埋め込みを用いた言語学習者のための語義別例文検索システム

NLP若手の回(YANS)で発表させていただいた研究です。

Poster image

データのダウンロード

wget https://dumps.wikimedia.org/other/cirrussearch/current/enwiki-20210802-cirrussearch-content.json.gz

事前処理

python ingest_sentences.py --input wiki --run yans
python embed_words.py --run yans
./postprocess_data.sh yans

ウェブUI

RUN=yans uvicorn web:app