/SOUhack

Kod och material relaterat till seminariet #SOUhack i KB:s serie Kulturarvet som ettor och nollor.

Primary LanguagePythonMIT LicenseMIT

(Summary in english below)

SOUhack

Kod och material relaterat till seminariet #SOUhack i KB:s serie Kulturarvet som ettor och nollor. Dataset: https://data.kb.se/datasets/2015/02/sou/

Semniariedelen

Seminariet genomfördes 20 oktober på Kungl. biblioteket i Stockholm. På förmiddagen hölls öppna föreläsningar av forskare som arbetat med SOU-materialet.

  1. Kort info om dagen av Peter Krantz, CIO på Kungl. biblioteket

  2. Pelle Snickars, Umeå universitet

  3. Gustav Holmberg: Expertis och intervention: Statens offentliga utredningar och 1900-talets vetenskapshistoria

  4. Christopher Kullenberg: Statens röst digitaliserad (PDF)

  5. Anders Fåk, Linköpings universitetsbibliotek: Fritextsökning för historiskt SOU-material

  6. Hillevi Hägglöf, Textual Relations: Kvantitativ samhällsanalys med språkteknologiska metoder

Open space

På eftermiddagen genomfördes en open space-övning runt tre teman:

  1. Topic modeling / begrepp
  2. Temporal analys av teman
  3. Möjligheter att sammankoppla materialet med annat material

Ett 40-tal deltagare samarbetade runt olika analyser av Statens offentliga utredningar som text.

Datamängder och kod som uppstod runt #SOUhack

  1. Samtliga SOU:er (även de moderna) som textdumpar

https://www.dropbox.com/sh/fxtle6ie0zpd5x7/AAAeHOrPMRYqACoBpinoPIx4a?dl=0 http://scientometrics.flov.gu.se/files/SOU19222015.zip

  1. Ordmoln över tid av Oivvio Polite/Liberationtech och ordvektorer per år

  2. Topic modeling: http://github.com/michiexile/sou-hack-word2vec

  3. Ordvektorer

Summary in english

The National Library of Sweden hosted the event #souhack to explore a specific document collection. Around 40 practitioners gathered to analyze bureaucratic texts through visualization and text analytics. The type of document - Statens offentliga utredningar - is a report published by government inquiry committees. The dataset used: https://data.kb.se/datasets/2015/02/sou/