keeleleek/pextract-xml

Multiple attested variable values in LMF

Opened this issue · 0 comments

Now document order is being relied on for grouping multiple variables together:

<ParadigmPattern>
  <feat att="id" val="asPliittõ"/>
  <feat att="comment" val="inflectional paradigm pattern for pliittõ"/>
  <feat att="example" val="pliittõ riittõ lauttõ"/>
  <feat att="partOfSpeech" val="noun"/>
  <AttestedVariableValues>
    <feat att="1" val="pliit"/>
    <feat att="2" val="õ"/>
    <feat att="1" val="riit"/>
    <feat att="2" val="õ"/>
    <feat att="1" val="laut"/>
    <feat att="2" val="õ"/>
  </AttestedVariableValues>```

Instead they should be semantically organized:
```xml
<ParadigmPattern>
  <feat att="id" val="asPliittõ"/>
  <feat att="comment" val="inflectional paradigm pattern for pliittõ"/>
  <feat att="example" val="pliittõ riittõ lauttõ"/>
  <feat att="partOfSpeech" val="noun"/>
  <AttestedVariables>
    <AttestedVariableValues>
      <feat att="1" val="pliit"/>
      <feat att="2" val="õ"/>
    </AttestedVariableValues>
    <AttestedVariableValues>
      <feat att="1" val="riit"/>
      <feat att="2" val="õ"/>
    </AttestedVariableValues>
    <AttestedVariableValues>
      <feat att="1" val="laut"/>
      <feat att="2" val="õ"/>
    </AttestedVariableValues>
  </AttestedVariables>```