Проект по хакатону Цифровой Прорыв 2024 ЮФО на тему "Поиск музейных предметов". Приложение доступно по адрессу к использованию и регистрации аккаунтов http://yufo.k-lab.su, в силу специфики поставщика услуг хостинга, на текущий момент не рекомендуется использовать SSL (https), поскольку в таком случае не будет рабоать загрузка изображений. Если проект запускается в Вашей среде, то для активации SSL задайте значение FORCE_HTTPS
в .env
как true
.
За статусом работы развернутого решения можно следить в #1
- Teamlead, ML —
Тищенко Дмитрий Александрович
- ML, Speech —
Жданов Александр Сергеевич
- Fullstack, ML —
Вебер Артем-Дариус Алексеевич
git clone https://github.com/xLagerFeuer/southhack-museumsearch-2024.git
cd southhack-museumsearch-2024
git checkout back-front
copy .env.dev .env
После чего настройте ваш .env файл
Установка пакетов
composer update
sudo docker-compose up -d
Теперь нужно зайти в контейнер Подключение к контейнеру:
sudo docker exec -it <container_id> bash
Миграции:
php artisan migrate
Публикация хранилища:
php artisan storage:link
Опционально, принудительный запуск очереди:
php artisan schedule:work
- Поиск изображений по вектороной базе данных
- Концепт использования эмбединга изображения и текста совместно для более точного семантического поиска
- Работа языковой модели для стандартизации текста по шаблону
- Концепт масштабирования стандартизации текста на большие данные
- Использование в тетрадях EVA02, resnet, Vit'ы для классификации текста
Реализация поисковой системы экспонатов музея через методы обработки естественного языка (NLP)
На рабочие данные необходим пайплайн через стандартизацию путем использования данных с соседей, вероятно, в том числе и изображения.
Редуцированный подход, в котором экземпляры ранижируются по ревелантности своих данных
Таким образом, при прохождении от наиболее ревелантным к наименее, мы можем формировать единый формат записи текста. Также можно рассмотреть переобобщение записей после 1 итерации.