Открытые данные на Карте слов

Карта слов — это онлайн-тезаурус русского языка, в котором каждый пользователь Рунета может найти ассоциации, синонимы, посмотреть контекстные связи и примеры предложений к словам и выражениям русского языка.

При создании сайта мы работаем с огромным количеством лингвистических данных. Некоторые датасеты показались нам довольно интересными и мы хотим поделиться ими с сообществом.

Датасеты

  • Открытая семантика русского языка — разметка слов и выражений русского языка по различным семантическим срезам. Включает в себя эмоционально-оценочный (тональный) словарь русского языка.

  • Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.

  • Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.

Контакты

Связаться с нами можно по электронной почте: kartaslov@mail.ru