/Senie

Seno tekstu projekta repozitorijs - dati un mājaslapa

Primary LanguageHTML

Latviešu valodas seno tekstu korpuss

Šī ir latviešu valodas seno tekstu korpusa iztrādes vide: atvērto datu un atvērtā pirmkoda repozitorijs.

Lietotājiem paredzētā publiskā vide ir brīvi pieejama Korpuss.lv platformā: korpuss.lv/id/Senie.

Repozitorija saturs

  • Sources - korpusa avotu faili un statistika.
  • Docs - topošā korpusa dokumentācija, specifikāciju faili.
  • TEI - korpusa dati, pārveidoti TEI formātā.
  • Indexing & Unicoding - korpusa apstrādes rīki.
  • DB & Web - ar korpusa tīmekļa vietni senie.korpuss.lv saisītais materiāls, datu medelis un saskarnes pirmkods (daļēji novecojis, pārejot uz NoSketch Engine platformu).

Pieejamība

Korpusa dati ir pieejami ar CC BY-SA 4.0 licenci.
Korpusa programmrīki ir pieejami ar GPLv3 licenci.

Izstrādātāji

LU Matemātikas un informātikas institūts
LU Latviešu valodas institūts