/datenanalyse-in-python

Kurs zur automatisierten Aufbereitung, Zusammenfassung und Erstellung von Diagrammen tabellarischer Daten mit Python.

Primary LanguageHTML

Datenanalyse in Python

Ergebnis

Nach diesem Kurs können Sie tabellarische Daten mit Python automatisiert aufbereiten, zusammenfassen und Diagramme erstellen.

Zielgruppe

Analysten, Wissenschaftler und Ingenieure, die größere Datenmengen effizienter handhaben möchten.

Voraussetzungen

Grundkenntnisse in Python

Kursbeschreibung

Die Python-Bibliothek pandas bietet ein praktisches Alltagswerkzeug zur Analyse tabellarischer Daten. Dieser Kurs verbessert Ihren Werkzeugsatz für die Arbeit mit Datensätzen von wenigen hundert bis einigen Millionen Einträgen in Python. Der Kurs behandelt an praktischen Beispielen sowohl die erkundende Datenanalyse, das Ermitteln von Kennzahlen und das Erstellen anschaulicher Grafiken. Durch die Integration mit interaktiven Analyseumgebungen wie IPython und Jupyter lassen sich viele Fragestellungen schnell umsetzen.

Kursdauer

14 Stunden

Agenda

Tag 1 Tag 2
Einführung in pandas Aggregatfunktionen
Datenaufbereitung Analyse von Zeitreihen
Daten zusammenfassen geographische Daten
Datenvisualisierung pandas in der Praxis

Tag 1

Einführung in pandas

  • Die Arbeitsumgebung zur interaktiven Datenanalyse
  • Kurzübersicht zu pandas
  • Series
  • DataFrame
  • Neuerungen in Python 3
  • Jupyter Notebooks

Datenaufbereitung

  • CSV- und Excel-Dateien in pandas einlesen
  • Daten sortieren
  • Daten filtern
  • Tabellen transponieren
  • Auswahl von Zeilen und Spalten
  • pandas-Tabellen speichern

Daten zusammenfassen

  • statistische Kenngrößen ermitteln
  • Tabellen zusammenführen
  • hierarchische Indizierung
  • Kreuztabellen
  • Pivot-Tabellen

Datenvisualisierung

  • Diagramme mit matplotlib erstellen
  • matplotlib aus pandas verwenden
  • Daten in Jupyter notebooks visualisieren
  • Heatmaps
  • Multi-Panel-Diagramme
  • qualitativ hochwertige Diagramme generieren
  • andere Bibliotheken zur Datenvisualisierung

Tag 2

Aggregatfunktionen

  • Iteration über Zeilen und Spalten
  • Gruppieren
  • Aggregieren
  • Transformieren
  • Anwenden eigener Funktionen

Analyse von Zeitreihen

  • Serien von Datumsstempeln
  • Umskalieren von Zeitreihen
  • Anpassen von Zeitzonen
  • Umgang mit lückenhaften Daten
  • rollender Durchschnitt
  • einfache Prognosen

Umgang mit geographischen Daten

  • Speichern von Koordinaten in pandas
  • Zeichnen von Karten mit Basemap

Pandas in der Praxis

  • Mythen und Fakten
  • Numpy
  • Modellbildung in scikit-learn
  • alternative Programmpakete und Strategien zur Datenmodellierung
  • Umgang mit großen Datenmengen
  • Best Practices