/NLP_Course

LU Datorikas fakultātes BSP studiju moduļa "Valodu tehnoloģijas" kursa "Valodu tehnoloģiju pamati" (DatZ1373) praktisko darbu materiāli

Primary LanguageJupyter NotebookCreative Commons Attribution 4.0 InternationalCC-BY-4.0

Valodu tehnoloģiju pamati (DatZ1373)

LU Datorikas fakultātes Bakalaura studiju programmas kurss

Praktiskie darbi

Rīkkopas valodas resursu priekšapstrādei

  1. Teksta izgūšana: TextExtraction.ipynb
  2. Teksta priekšapstrāde: TextPreprocessing.ipynb

Galīgie automāti un pārveidotāji

  1. Morfoloģiskā analīze un sintēze: HFST.ipynb
  2. Teksta izvēršana un savēršana: Thrax.ipynb, Pynini.ipynb

Gramatiskā analīze

  1. Latviešu valodas morfoloģiskais analizators un sintezators: TezaursAPI.ipynb
  2. Rīkkopas universālo atkarību parsēšanai: ParsingUD.ipynb

Statistiskie valodas modeļi

  1. N-grammu modeļi: TBA
  2. Teksta klasificēšana: TextClassification.ipynb
  3. Word2vec apmācība un lietojums: w2vec.ipynb

Autori

prof. Inguna Skadiņa
asoc. prof. Normunds Grūzītis
asistents Viesturs Jūlijs Lasmanis

Atbalsts

Kursa izstrādi finansē Eiropas Savienības Atveseļošanas un noturības mehānisma investīcija un valsts budžets projekta “Valodu tehnoloģiju iniciatīva” (2.3.1.1.i.0/1/22/I/CFLA/002) ietvaros.