Реализован алгоритм бинаризации Niblack
Based on
В приложенном датасете суммарно 111,8
Мпикс, они обработались за 280.6
секунд. (Intel® Core™ i7-8750H CPU @ 2.20GHz × 12)
Скорость приблизительно 0,4
Мпикс/сек
Параметры по умолчанию: стартовый размер окна 30 пикс., коэффициент k
= -1.
g++ ImageMagick CImg library
В папке выполните:
make
./runall.sh
На готовый результат работы можно посмотреть в архиве processed.zip
.
- Плохо работает на изображениях, где белый текст изображен на черном фоне
- Хорошо выделяет фрагменты черного текста на белом фоне, но много шумов на фоне без текста. Эта проблема еще описывалась в статье [1]. Можно попробовать прикрутить denoiser, или исопльзовать чуть более продвинутые техники.
- В алгоритме практически нет гиперпараметров, основной гиперпараметр --
k
(вес стандартного отклонения в формуле для threshold).