robot-lab/judyst-research

Проверить гипотезу об автомате

Closed this issue · 1 comments

Idea proposal

В чём заключается идея

Необходимо создать некоторый конечный автомат для поиска сущностей, называемых ссылкой, способный определить их и извлечь из сущности ссылку в некоторой “нормальной форме”.
(Данная задача может быть неудачной)

Дополнительный контекст или ссылки на связанные с данной задачей issues

Из-за специфики регулярных выражений и присутствующих в них средствах пост-обработки данных, невозможно создать эффективный конечный автомат, ДКА, который бы работал за линейное время. Для достижения этой цели придётся полностью переделывать модуль анализа текста, что потребует дополнительных трудозатрат.

При прямом преобразовании текущих регулярных выражений в КА мы получаем e-НКА, трудоёмкость которого может достигать экспоненциальной сложности. В связи с этим, данная задача не принесёт никакого прогресса в проект (при незатратном подходе с переиспользованием текущей базы кода библиотеки для анализа текстов).