LUMII-AILab/LVWordNet

Vai saīsinājumi var būt lokāmi

Opened this issue · 2 comments

lauma commented

Vai tādi saīsinājumi kā k-gs un k-dze ir lokāmi? Ja jā, tad jāizdomā, kā attēlot viņus tēzaurā. Vai tie lokās pēc parastajām lietvārdu paradigmām, piem., pēc 1. un 5. deklinācijas sistēmas?

Kādam tagam būtu jābūt pie vārdformas "k-dzei" ? Ja es pieliktu lokāmu k-gs 1. deklinācijas paradigmā, tad viss darbotos, bet tam būtu n..... tags nevis yn kā pašreiz.

Tas ir mazliet tālāk par to, kad mēs savulaik ieviesām saīsinājumu tagu sadalījumu atbilstoši saīsinātajai vārdšķirai.

Konceptuāli visiem lietojumiem kas iet tālāk par morfoloģijas/vārda līmeni - sintakse, semantika, utt - saīsinājums ir ekvivalents saīsinātajai lietai; tādi lietojumi priecātos, ja "k-dzei" būtu ekvivalenti atribūti kā "kundzei", vienīgi ar papildnorādi, ka tas ir saīsinājums; ja "piem." tiktu sintaksē traktēts pilnīgi ekvivalenti kā "piemēram". Tas, šķiet, saskan ar UD pieeju https://universaldependencies.org/u/feat/Abbr.html

Ir tehniska problēma tajā, ka vecajā MULTEXT-EAST stila marķējumā (lemma + pozicionāls tags) nav praktiski norādīt papildu atribūtus. Bet tā ir plašāka sāpe, kas apgrūtina arī citas lietas. Ja mēs ilgtermiņā karodziņu/atribūtu sistēmu ko lieto Tēzaurs un morfoanalizators pamazām izplestu uz citiem rīkiem, iekļaujot to arī korpusu anotācijā, tad varbūt tas būtu ilgtermiņa risinājums, bet nu tas būtu paliels projekts.

lauma commented

Temporāli var ielikt "k-dze" noun-5a paradigmā un pielikt viņai vārdšķiru saīsinājums - no Tēzaura viedokļa var sataisīt smuki, no analizatora viedokļa būs informācija, bet tageris var arī nošauties par tādu perversiju