/hd

Primary LanguagePython

Hurtownie danych i przetwarzanie analityczne - projekt laboratoryjny

Projekt zaliczeniowy na laboratoria przedmiotu Hurtownie danych i przetwarzanie analityczne, prowadzone przez profesora Roberta Wrembla na Politechnice Poznańskiej. Projekt powstaje przy współpracy z panem Michałem Bodzionym z firmy IBM.

Dokumentacja techniczna projektu jest dostępna do wglądu tutaj.

TODO

Implementacja:

  • MongoDB - podstawowe zapytania
  • Cassandra - podstawowe zapytania
  • SQL Server - podstawowe zapytania
  • Kafka - podstawowe zapytania (lokalnie)
  • Kafka - podstawowe zapytania (w źródle - pyspark.sql module)
  • Cassandra - join
  • User Interface
  • testy podstawowych zapytań (Cassandra i SQLServer)

Testy i analiza:

  • MongoDB - optymalizacja zapytań
  • Cassandra - optymalizacja zapytań
  • Kafka - optymalizacja zapytań
  • SQL Server - optymalizacja zapytań

Inne:

  • Dokumentacja
  • Prezentacja końcowa