/testik

Primary LanguagePython

testik

тестовое задние для ртл

Описать, какие методы и приёмы позволят провести подобный расчет для «большого» набора входных данных, когда исходные данные лежат в БД, а их объём не позволяет поместить результирующие данные в один датафрейм в оперативной памяти.

  • Можно выполнить агрегацию и фильтрацию на стороне базы данных – это позволить получить только необходимые для обработки данные. Так же на стороне БД можно реализовать какие-либо этапы бизнес логики с использованием хранимых процедур для минимизации передаваемых данных.
  • Сам данные можно считывать по частям, разбивать их на батчи и по очереди обрабатывать.
  • Также можно сохранять промежуточные значения не обходимые для дальнейшего вычисления, как в саму БД, так и использовать другие форматы файлов.