Thesis title: How idiosyncratic are collocations? Methods of clustering academic speech collocations
Repository descriprion:
c-value - code for computing C-value
different corpora... - experiments with comparing other Russian corpora to CAT
domain_specificity - determining domain specificity of each domain's collocations
collocation graphs - experiment with collocation clustering
Code of other (not this thesis-related) experiments with CAT collocations and for collocation lists assembling can be found here: https://github.com/MariaFjodorowa/catandthekittens/tree/develop/collocations
CAT Collocation Lists can be found here: https://drive.google.com/drive/folders/1k_N-DZ-nLL5ro66-LxIaE4-dRwirdwZh
Название работы: Насколько идиосинкратична коллокация? Методы кластеризации коллокаций академической речи
Описание репозитория:
c-value - вычисление C-value
different corpora... - эксперименты со сравнениями других корпусов русских текстов и CAT
domain_specificity - определение доменной специфичности коллокаций каждого подкорпуса
collocation graphs - эксперимент с кластеризацией коллокаций
Код других экспериментов с коллокациями САТ, не связанных с этой работой, а также для создания коллокационных списков можно найти здесь: https://github.com/MariaFjodorowa/catandthekittens/tree/develop/collocations
Коллокационные списки Русского академического корпуса можно найти здесь: https://drive.google.com/drive/folders/1k_N-DZ-nLL5ro66-LxIaE4-dRwirdwZh