freeling_ru

sentences_in.py — принимает на вход все файлы снятника и очищает от разметки. На выходе готовый текст, который можно анализировать с помощью freeling.

freeling2ruscorpora.py — конвертер тегов freeling > ruscorpora.

gold.py — создает золотой стандарт из снятника.

evaluation.py — построчно сравнивает два файла по принципу "если словоформы равны -> сравнить лемму -> проверить совпадение тегов". При частичном совпадении тегов (например, совпала только часть речи) присваивается определенный "вес", который можно настраивать. Над этим еще надо подумать.