kuadam/hd

Python

Hurtownie danych i przetwarzanie analityczne - projekt laboratoryjny

Projekt zaliczeniowy na laboratoria przedmiotu Hurtownie danych i przetwarzanie analityczne, prowadzone przez profesora Roberta Wrembla na Politechnice Poznańskiej. Projekt powstaje przy współpracy z panem Michałem Bodzionym z firmy IBM.

Dokumentacja techniczna projektu jest dostępna do wglądu tutaj.

TODO

Implementacja:

MongoDB - podstawowe zapytania
Cassandra - podstawowe zapytania
SQL Server - podstawowe zapytania
Kafka - podstawowe zapytania (lokalnie)
Kafka - podstawowe zapytania (w źródle - pyspark.sql module)
Cassandra - join
User Interface
testy podstawowych zapytań (Cassandra i SQLServer)

Testy i analiza:

MongoDB - optymalizacja zapytań
Cassandra - optymalizacja zapytań
Kafka - optymalizacja zapytań
SQL Server - optymalizacja zapytań

Inne:

Dokumentacja
Prezentacja końcowa