eb4j/dsl4j

Something wrong with HTMLVisitor

Closed this issue · 2 comments

plotn commented

Hi! I'm trying to get familiar with html visitor and I think it generates wrong result.
See the "apresyan example (you have)" - word "clear":

Original article:

clear
 [b]1.[/b] \[klıə\] [com][i][c][p]a[/p][/c][/i][/com] [trn][m2]1. ясный, светлый [/m]
 [m3][*][ex][lang name="English"]~ day[/lang] - ясный день [/ex][/*][/m]
 [m3][*][ex][lang name="English"]~ sky[/lang] - чистое /ясное, безоблачное/ небо [/ex][/*][/m]
 [m2]2. 1) чистый, прозрачный [/m]
 [m3][*][ex][lang name="English"]~ water of the lake[/lang] - чистая /прозрачная/ вода озера [/ex][/*][/m]
 [m3][*][ex][lang name="English"]~ glass[/lang] - прозрачное стекло [/ex][/*][/m]
 [m2]2) зеркальный ([com][i]о поверхности[/i][/com]) [/m]
 [m2]3. отчётливый, ясный [/m]
 [m3][*][ex][lang name="English"]~ outline[/lang] - ясное /отчётливое/ очертание [/ex][/*][/m]
 [m3][*][ex][lang name="English"]~ sight[/lang] - хорошее зрение [/ex][/*][/m]
 [m3][*][ex][lang name="English"]~ reflection in the water[/lang] - ясное отражение в воде [/ex][/*][/m]
 [m3][*][ex][lang name="English"]~ view[/lang] - хорошая видимость [/ex][/*][/m]

Generated HTML:

[lang id=1033]clear</span> 1. [lang id=1033]adj.
1)</span> ясный, светлый; [lang id=1033]clear sky -</span> безоблачное небо
[lang id=1033]2)</span> прозрачный
[lang id=1033]3)</span> чистый (о весе, доходе; о совести)
[lang id=1033]4)</span> свободный [lang id=1033]- clear passage - all clear - all clear signal - clear from suspicion - clear of debts - clear line
5)</span> целый, полный [lang id=1033]a clear month -</span> целый месяц
[lang id=1033]6)</span> ясно слышный, отчетливый
[lang id=1033]7)</span> понятный, ясный, недвусмысленный
[lang id=1033]8)</span> ясный (об уме) [lang id=1033]to get away clear -</span> отделаться [lang id=1033]- in clear - keep clear of Syn: definite, distinct, unmistakable see transparent Ant: blurred, confused, doubtful, foggy, fuzzy, muddled obscure, unclear, unintelligible, vague</span> 2. [lang id=1033]adv.
1)</span> ясно [lang id=1033]to see one's way clear -</span> не иметь затруднений
[lang id=1033]2)</span> совсем, целиком (тж. несколько усиливает знач. наречий [lang id=1033]away, off, through</span> при глаголах) [lang id=1033]three feet clear -</span> целых три фута 3. v.
[lang id=1033]1)</span> очищать(ся); расчищать [lang id=1033]to clear the air -</span> разрядить атмосферу; положить конец недоразумениям [lang id=1033]to clear the dishes -</span> убирать посуду со стола [lang id=1033]to clear the table -</span> убирать со стола
[lang id=1033]2)</span> освобождать, очищать от чего-л., кого-л. [lang id=1033](of) Will you help me clear the garden of these stones? We must clear the area of enemy soldiers as soon as possible.
3)</span> становиться прозрачным (о вине)
[lang id=1033]4)</span> проясняться
[lang id=1033]5)</span> рассеивать (сомнения, подозрения)
[lang id=1033]6)</span> оправдывать, снимать подозрение в чем-л. [lang id=1033](of) The boy was cleared of the charge of stealing. The boy was cleared of taking part in the crime.
7)</span> эвакуировать

It is even not well formed nor contains any valid html formatting....

I've added a test case with your reported source data as #82 and it does not produce a content you reported.
Could you please provide a reproducible?

Fix is merged.