cscenter/SInGe

изучить open-vcdiff на предмет того, как он кодирует

Opened this issue · 2 comments

надо понять, как правильнее считать баллы для подстрок, тк у vcdiff'а свои секреты. Есть своя минимальная длина, есть всякий меджик, по которому он выбирает, что и на какую длину кодировать.

Минимальная длинна совпадения, с которой начинает кодировать это BlockHash::kBlockSize = 16

open_vcdiff не использует понятие "окна" для сжатия по SDCH, т.к. стандарт запрещает при сжатии использовать информацию из документа, как из словаря, следовательно разбивать документ на окна нет надобности.