Python 2
- Informace o kurzu na webu Czechitas.
- Návod na odevzdávání úkolů na GitHub je zde.
Týden | Blok | Téma | Odkaz |
---|---|---|---|
1. | Pandas a vizualizace | Úvod, Jupyter notebooky, vizualizace | odkaz |
2. | Pandas a vizualizace | Pivot tabulky, práce s datem a časem | odkaz |
3. | Pandas a vizualizace | Použití vlastních funkcí, funkce shift | odkaz |
4. | Statistické metody | Popisná statistika a testování hypotéz | odkaz |
5. | Statistické metody | Hypotézy a statistická rozdělení | odkaz |
6. | Statistické metody | Korelace a regrese | odkaz |
7. | Strojové učení a umělá inteligence | Binární klasifikace s využitím KNN | odkaz |
8. | Strojové učení a umělá inteligence | Klasifikace s využitím SVC | odkaz |
9. | Strojové učení a umělá inteligence | Rozhodovací stromy | odkaz |
10. | Strojové učení a umělá inteligence | Shlukování | odkaz |
11. | Strojové učení a umělá inteligence | Zpracování přirozeného jazyka | odkaz |
12. | Strojové učení a umělá inteligence | Doporučování obsahu | odkaz |
Podmínky absolvování kurzu
- Účast na lekcích (min. 80 %)
- Vyplnění opakovacího kvízu (bude zadán po každé lekci, na vyplnění budou dva týdny, je třeba mít správně alespoň 50 % otázek, všechny testy musí být odevzdány nejpozději týden po poslední lekci).
- Odevzdání domácích úkolů:
Další zdroje
- Mapping with Matplotlib, Pandas, Geopandas and Basemap in Python Mapa světa, lze použít např. pro analýzu tržeb firmy.
- Pandas User Guide
- Visualization and Interactive Dashboard in Python
- Data Analyst vs Data Engineer vs Data Scientist: Skills, Responsibilities, Salary
- Data Scientist vs Data Analyst vs Data Engineer
Pandas a vizualizace
Příklady:
- Délka po sobě jdoucích událostí pomocí shift.
- Kontrola následující události pomocí shift.
- Výpadky televizního signálu a jejich slučování.
Tipy na vizualizace:
- Hat graph,
- Discrete distribution as horizontal bar chart,
- Scatter plot with histograms,
- Scatter Masked,
- hlines and vlines,
- Creating annotated heatmaps,
- Box plots with custom fill colors,
- Time Series Histogram,
- Nested pie charts
Seaborn:
Statistické metody
- Statistics Lecture - Série přednášek o statistice a testování hypotéz. Sice v angličtině, ale v pomalém a klidném tempu.
- StatistikaJednoduse.cz - Stránka s dalšími texty o statistice a příklady výpočtů testu v Excelu.
- p-values: What they are and how to interpret them - Vysvětlení p-hodnoty na příkladu s porovnáním účinnosti léků.
Strojové učení a umělá inteligence
- Elements of AI (CZ, EN) - Bezplatný online kurz, jehož cílem je demystifikovat umělou inteligenci. Kurz kombinuje teorii s cvičeními.
- ML for Beginners (EN, ale aktivně překládaný do dalších jazyků dobrovolníky) - Veřejně dostupný a bezplatný kurz klasického strojového učení od Microsoftu. Připravuje se i kurz "AI for Beginners" a již existuje "Data Science for Beginners"
- How to Use t-SNE Effectively (EN) - Článek o metodě t-SNE, jejích parametrech a interpretaci. Článek doprovází spousta (interaktivních) vizualizací.