membahas dasar python syntax
membahas beautifulsoup4, requests:
- mencari isi element, tag, maupun atribut pada html
- save file/text ke local disk https://github.com/ml-its/ds-notebook/tree/week2
membahas pagination scraping, pandas:
- mengambil beberapa page dari indeks.kompas.com
- mencari judul, link, foto pada berita
- save hasil scraping ke
.csv
https://github.com/ml-its/ds-notebook/tree/week3
mendatangkan pemateri Doni Rubiagatra
membahas wordcloud, tfidf
- preprocessing:
- filtering stopword
- stemming
- dicitonary
- memakai
Counter
daricollections
- membuat wordcloud dari
csv
kompas https://github.com/ml-its/ds-notebook/tree/week4