/cv-corpus

Corpus of Chuvash language made created from wiki dump

Primary LanguagePython

Chuvash language corpus

Made from wiki dumps https://dumps.wikimedia.org/cvwiki/20181120/

  • Texts count: 801
  • Sentences count: 9785
  • Words count: 196663
  • Symbols count: 851004

Tokenized and converted to TEI.

Чăваш чĕлхин çӳпçи

Чăваш википеди пухӑвӗ https://dumps.wikimedia.org/cvwiki/20181120/

  • Текстсен хисепӗ: 801
  • Предложени хисепӗ: 9785
  • Сӑмах хисепӗ: 196663
  • Саспаллисен хисепӗ: 851004

TEI форматпа вулама пулать