Скачать корпус.
Download the corpus.
See below for the English version.
В этом репозитории содержатся рабочие материалы для подготовки русскоязычного референциального корпуса.
Инструкция по разметке кореферентных цепочек
Инструмент для разметки:
python coref_markup.py
Инструмент слияния разметок:
python merge.py text_1.json text_2.json --out text_merged.json
Инструмент сравнения разметок:
python diff.py text_1.json text_2.json
Спасибо нашей замечательной команде аннотаторов:
- Арина Акимова
- Денис Булаев
- Дарья Власова
- Ирина Гусева
- Дарья Дьячкова
- Амина Зиновьева
- Анастасия Каверина
- Виктория Малафеева
- Юлия Скрипкарь
- Мария Уварова
- Людмила Шляхтина
- Анжела Шумилова
- Нина Юрчук
- Лиса была здесь
This repository contains work materials for an upcoming Russian coreference dataset.
Markup tool:
python coref_markup.py
Markup merge tool:
python merge.py text_1.json text_2.json --out text_merged.json
Markup diff tool:
python diff.py text_1.json text_2.json
Many thanks to our amazing annotators' team:
- Arina Akimova
- Denis Bulaev
- Darya Dyachkova
- Irina Guseva
- Anastasiya Kaverina
- Victoria Malafeeva
- Liudmila Shlyakhtina
- Angela Shumilova
- Julia Skripkar
- Mariya Uvarova
- Daria Vlasova
- Nina Yurchuk
- Amina Zinowyeva
- Lisa was here