/cagliari2019

Lezioni di linguistica dei corpora tenute all'Università di Cagliari nel maggio 2019

Primary LanguageTeX

cl-cagliari2019

Pdf e dati delle lezioni sulla linguistica dei corpora tenute a Cagliari a maggio 2019. (talamo.luigi - chiocciola - gmail.com)

Slide/Lucidi

  • corpuslinguistics.tex: sorgente LaTeX per compilarsi da sé il PDF;
  • corpuslinguistics.pdf: PDF delle lezioni.

Esercizio sulla produttività in Morfologia

  • ame.txt: lista di frequenza delle costruzioni in -ame nel corpus la repubblica.

Esercizio sulla Sintassi

  • ditransitive.txt: lista di frequenza delle costruzioni ditransitive con i verbi tell, give, play e bring nei primi 100M del corpus ukWac;
  • ditransitive/: si trovano le occorrenze originali delle costruzioni ditransitive di cui sopra.

Esercizio sull'annotazione TEI

  • achille.xml, berte.xml: file xml con testi di canzoni di Sanremo da etichettare per TEI-Header, verso e strofa;
  • mahmood.xml: file xml di esempio già etichettato.

Elan

  • activity_unproductive.wav: file WAV da annotare;
  • this_activity.eaf: file di Elan annotato.

Miscellanea

  • san_martino.csv: la poesia San Martino tokenizzata con annotazione posizionale;
  • manual-elan_ug.pdf: PDF del manuale ufficiale di Elan.