Pliki w niniejszym repozytorium udostępnione zostały zgodnie z zasadami
otwartej licencji BSD-2-clause i stanowią materiał uzupełniający do książki.
Celem autorów książki jest przygotowanie Czytelnika do samodzielnego
przeprowadzenia całego procesu analizy danych, od pobrania i załadowania
zbioru, przez jego wstępne przetworzenie i wyczyszczenie, aż po samą analizę,
wizualizację wyników i ich interpretację. Wiemy, że pewne rozwiązania,
które stworzy Czytelnik, przeznaczone będą do wielokrotnego użytku
i tym samym zasługiwać będą na wdrożenie w ramach większych projektów
informatycznych. Z tego powodu omawiamy także zestaw dobrych praktyk
inżynierii oprogramowania.
Publikacja zawiera szereg przykładów, od prostych do bardziej rozbudowanych,
pozwalających zrozumieć nie tylko poszczególne etapy procesu analizy danych,
ale również zasady funkcjonowania środowiska Python 3. Czytelna struktura
książki umożliwia osobom mającym już pewną wiedzę łatwe wyszukanie tylko
wybranych, interesujących ich zagadnień.
„Przetwarzanie i analiza danych w języku Python” jest podsumowaniem
doświadczeń autorów wyniesionych z zajęć prowadzonych na Wydziale Matematyki
i Nauk Informacyjnych Politechniki Warszawskiej (m.in. dla studentów
matematyki i informatyki ze specjalności dotyczących statystyki matematycznej,
analizy danych i data science), licznych szkoleń
(np. dla Data Science Retreat w Berlinie), a także z pracy naukowo-badawczej
w Instytucie Badań Systemowych Polskiej Akademii Nauk oraz w Instytucie Podstaw
Informatyki PAN w ramach International Ph.D. Studies Program
(m.in. w dziedzinie analizy i agregacji danych).
Poglądowy spis treści
1.Wprowadzenie
2.Typy skalarne
3.Typy sekwencyjne i iterowalne
4.Słowniki i zbiory
5.Instrukcje sterujące
6.Funkcje
7.Wektory, macierze i inne tablice
8.Ramki danych
9.Przetwarzanie napisów
10.Przetwarzanie plików i zasobów w internecie
11.Dostęp do baz danych
12.Wizualizacja danych
13.Wnioskowanie statystyczne
14.Wybrane algorytmy uczenia maszynowego
15.Moduły, pakiety i skrypty
16.Programowanie obiektowe
.Bibliografia
.Skorowidz
Szczegółowy spis treści
1.Wprowadzenie
1.1.Język i środowisko Python
1.1.1.Instalacja dystrybucji środowiska Python
1.1.2.Instalacja pakietów
1.2.Notatniki Jupyter
1.2.1.Tryby pracy
1.2.2.Najważniejsze skróty klawiszowe
1.2.3.Podstawy języka Markdown
1.3.Pierwsze kroki w języku Python
2.Typy skalarne
2.1.Liczby
2.1.1.Operatory arytmetyczne
2.1.2.Konwersja typów
2.1.3.Tworzenie obiektów nazwanych
2.1.4.Funkcje wbudowanie
2.1.5.Pola i metody
2.1.6.Arytmetyka zmiennopozycyjna
2.2.Wartości logiczne
2.2.1.Operatory relacyjne
2.2.2.Operatory logiczne
2.3.Napisy
2.3.1.Tworzenie napisów
2.3.2.Podstawowe operacje na napisach
3.Typy sekwencyjne i iterowalne
3.1.Podstawowe rodziny obiektów typu sekwencyjnego
3.1.1.Listy i krotki
3.1.2.Zakresy
3.1.3.Napisy
3.2.Zarządzanie elementami
3.2.1.Wybieranie elementów
3.2.2.Modyfikacja elementów
3.2.3.Dodawanie i usuwanie elementów
3.2.4.Kopiowanie referencji, kopiowanie płytkie a głębokie
3.3.Obiekty iterowalne
3.4.Działania na obiektach iterowalnych i typu sekwencyjnego
3.4.1.Podstawowe metody i funkcje
3.4.2.Krotki identyfikatorów po lewej stronie operatora przypisania
3.4.3.Wyrażenia listotwórcze i generatory
3.4.4.Formatowanie napisów
4.Słowniki i zbiory
4.1.Słowniki
4.1.1.Tworzenie słowników
4.1.2.Podstawowe metody i funkcje
4.2.Zbiory
4.2.1.Tworzenie zbiorów
4.2.2.Podstawowe metody i funkcje
5.Instrukcje sterujące
5.1.Instrukcja warunkowa
5.2.Pętle
5.2.1.Pętla while
5.2.2.Pętla for
5.2.3.Instrukcje break i continue oraz blok else w pętlach
5.3.Obsługa wyjątków
5.3.1.Zgłaszanie wyjątków
5.3.2.Rodzaje wyjątków
5.3.3.Wychwytywanie wyjątków
6.Funkcje
6.1.Definiowanie funkcji
6.1.1.Dokumentowanie funkcji
6.1.2.Wartość zwracana
6.1.3.Wyrażenia lambda
6.2.Parametry i argumenty
6.2.1.Sposób przekazywania argumentów
6.2.2.Sprawdzanie poprawności argumentów
6.2.3.Dopasowywanie argumentów
6.2.4.Parametry z argumentami domyślnymi
6.2.5.Rozpakowywanie argumentów
6.2.6.Parametry specjalne *args i **kwargs
6.3.Zasięg zmiennych
6.3.1.Zmienne lokalne
6.3.2.Zmienne globalne
6.3.3.Zmienne nielokalne, fabryki funkcji i domknięcia