Closed this issue 10 months ago · 1 comments
Ich werde hier mal sachen reinschicken die nicht nicht verstehe. Hier wäre es z.b warum wir das UNK token komplett removen ? Zerschießen wir uns dann nicht immer das komplette alignment weil dann ja ein wort fehlt?
https://github.com/Algo-Boys/SWR2-cool-projekt/blob/9bb4ffbd0ef84bfea428112495cc63266e3b0955/swr2_asr/tokenizer.py#L332-L337 Das ToDo ist fertig