Директории | Описание |
---|---|
/img | изображения, используемые в этом проекте |
/materials | статьи и прочие материалы |
/mmcs_sfedu_thesis | шаблон для диссертации |
/tex | разные латеховские файлы |
Тема: Разработка мобильного приложения для улучшения качества распознавания фотодокументов в затрудненных условиях съемки
- создание фотографий документа
- как это делается?
- предобработка изображений с целью увеличения качества изображения
- восстановление документа из серии изображений
- распознавание текста с привлечением с интеллектуальных методов обработки текста для восстановления потерянных фрагментов
- (?) оценить уровень достоверности восстановленного фрагмента
-
Анализ области + литература
- Что есть для предобработки изображений под FPGA? (ip ядра, алгоритмы, насколько это вообще доступно)
- Конкретно про lattice прошлый пункт
- Запустить демку
- На чем писать под lattice?
- использовать ядра lattice
-
В обработке изображения должен участвовать алгоритм CLAHE (адаптивная эквализация гистограммы)
-
Также хорошо себя показывает кусочно линейное преобразование (промежуток цвета загоняем в одно значения). Работает лучше отсечения по одной какой-то границе. Но остается задача подбора границ.
-
У полученных изображений нужно компенсировать освещенность, чтобы цвет документа был однородным. Можно перенять опыт из статьи "Коррекция освещения в распознавании лиц.pdf". Алгоритм https://github.com/ofgulban/iphigen. На картинке видна разница с изображением из прошлого пункта.
-
для выбора порога на первых этапах можно использовать метод Отцу (желательно, с компенсацией освещения)
-
для уменьшения шума можно воспользоваться усреднением изображений
- Будем моделировать методы? (макет на распберри, макет на пк без камеры и тд)
- С чего начнем? С методов или с плисы?
- Как организовать тестирование и отладку? плиса постоянно воткнута в монитор? сохраняет в память и передает на пк?
- На какие риски надо ориентироваться?
- Двигаться короткими итерациями через модификацию исходной демки
- Использовать тесты (приходит обновление, она собирает куски проекта в специальном тестовом состоянии, загружает в память картинку, запускает обработку, сравнивает с ожидаемым результатом и находит отклонение)
- Написан n проектов ради обучения VHDL
- Отключить одну камеру
- Сделать камеру на весь экран
- Реализовать сохранение изображения в память ???
- Научиться заменять камеру на память ???
- Написать тестовую систему ???
- Реализовать перевод в оттенки серого
- Реализовать бинаризацию по заданному порогу
- Реализовать один из методов нахождения порогу (отсу)
- Реализовать фильтрацию ???
- Реализовать интерполяцию ???
- Реализовать нормализацию гистограммы
- Реализовать эквализацию (обычную или CLAHE)
- Реализовать сегментацию изображения
- Реализовать обнаружение присутствия документа в кадре