1. Сначала нужны данные, чтобы делать проект. Проект, связанный с продуктовыми товарами в магазинах. Данные в базу данных получаем путём парсинга сайтов магазинов основных ретейлеров, 5ка, лента, кб, спар, монетка, ашан, мавт, etc. Все данные нужно привести к единому формату полей (наименование, цена, акция/не акция, средняя стоимость за последние N дней, итд тут много можно придумать фич).
  2. Из основной идеи применения данных - это по фотографии товара в магазине на полке понять что это за товар, определить тип магазина(по ценнику, они везде разные), пробить по базе этот товар (по названию или артиклю или штрих-коду, здесь тоже поле огромное для идей как именно матчить, названия на сайте и ценнике могут отличаться), и сравнить его с другими магазинами, понять, насколько стоимость данного товара адекватна в среднем по рынку? Не продаётся ли этот товар в соседнем магазине в 2 раза дешевле со скидкой?
  3. Также из идей, составлять по мере использования приложения базу данных товаров, как они выглядят, потом чтобы можно было матчить.
  4. Перед тем как идти в рандомный магазин за покупками, вбиваешь продуктовую корзину, что хотел бы купить, и тебе предлагается магазин где в сумме будет наименьшая стоимость, если ты только в один магазин, либо по нескольким, чтобы собрать в итоге минимальную сумму покупок.
  5. Улучшение списка товаров, это сфоткать чек, который распознается и составляется автоматом список товаров, и ты можешь сам добавлять/убирать товары. Типа личный стандартный продуктовый набор. В дальнейшем можно запоминать историю заказов и рекомендации давать по списку.
  6. Улучшение, это воссоздать в метавселенной магазин, сходить в него в VR шлеме, «закупиться», составив тем самым список товаров которые ты бы реально купил, если бы посетил магазин физически, и оформить по этому списку доставку. Но это идея на попозже.
  7. Сделать сайт и приложение для телефонов.
  8. Адаптация моделей к мобилкам.
  9. ...

Стек технологий:

Базовые: Python, база данных PostgreSQL или MongoDB, асинхронное программирование (asyncio, aiohttp), data mining, FastAPI, etc.

На первых порах, сделать: асинхронного telegram бота на aiogram, простейшую аналитику цен товаров, матчинг по названию товара

Следующий шаг: PyQT (web/mobile)

В перспективе: Docker, брокер сообщений RabbitMQ или Apache Kafka, data pipeline Airflow или Kafka, Grafana, ClickHouse, etc. (для упрощения развертывания и аналитики по всему проджекту)

В ближайшей перспективе (первичный функционал): Детекция и распознавание текста ценника, матчинг по базе, и простая аналитика стоимости (где дешевле, в какой магазин лучше идти, итд)

В отдаленной перспективе (сложно и долго пилить): Распознавание самого товара и матчинг, база данных изображений пользовательских товаров, VR (интересно, но нужен шлем и время на разработку)