Kunskapsfråga - (out of context)

Question

Kunskapsfråga - (out of context)

Closed this issue 2 years ago · 55 comments

Cool video! Lärde mig mycket. Såg att du visade att openstreetmap kan länka tillbaka till ett q-nummer i wikidata. Vet du om det används av arbetsgivare för att beskriva sina arbetsplatser/företag i någon omfattning idag? Finns lite att utforska för vår verksamhet tänker jag (jobtech/af)? Sorry att jag smutsar ner din tråd om utegym. Kan slänga in en fråga om utegym, har märkt att flertalet utegym har chinsstänger som är designade av personer som aldrig gjort en chin, dvs att stången inte är stum. Antar att den datapunkten inte i ditt dataset.. =)

Answer 1 · 2022-09-09T06:11:51.000Z

Det är nästan inga privata svenska företag i Wikidata i dagsläget. Det finns vad jag vet inga öppna data alls om privata svenska företag.
Företagen skulle själva ihop kunna göra en graf, för den datamängden kanske inte passar jättebra i Wikidata.
Alla världens företag kommer troligtvis aldrig att läggas in i Wikidata.

Answer 2 · 2022-09-09T07:41:02.000Z

@jonassodergren smuts sparar jag på så mer tack

att flertalet utegym har chinsstänger som är designade av personer som aldrig gjort en chin, dvs att stången inte är stum.>

Jag är inte där ens i tanken mina tankar snurrar mer kring att man borde ha länkade data från leverantörerna vilka maskiner dom levererar och vilka muskelgrupper dom tränar se mina tankar vid min 19:00

Tanke QRC koder på alla kommuners saker
@jonassodergren vi pratade om persistenta dentifierare,... en QRC kod är en kandidat till en persistent identifierar --> den skulle finnas på alla enskilda utegyms stationer så man kan

skicka in feedback
kan se vilka övningar som kan göras och träningsvideo
kunna logga i en app att på maskin xxx med detta länkade datat loggade jag 15 reps, eller om man kör omnigym tror jag dom loggar även vikten man kör med (finns i Sollentuna sedan förra veckan)

Tanke 2
Har man QRC kod och länkade data så skulle din feedback på chins enkelt kunna sammanlänkas med alla andra feedback på chins stänger....

typ du skulle kunna filtrera och se vad andra gett för feedback på samma utrustning, samma plats eller i Stockholm...
- typ Tinder där jag kan välja babes på avstånd och ålder skall du kunna se feedback på chinsstänger
- men precis som Tinders passport skulle du kunna hoppa över till andra utrustningar

Snygg lösning Stockholms stad feedback
Stockholms stad har tror jag köpt in ett verktyg att visa feedback för en stadsdel på en karta.... liknande bprde kunna gå att göra med utegym men kanske ha muskelgrupper, "karta där man har ont" osv....

OT BILDER

jag besöker långsamt utegym och tar foton och försöker prata med folk länk senaste utegymsbilderna / enbart mina bilder
- exempel hur vi strukturerar Järfälla kommuns utegymsbilder
- exempel hur enkelt vi med SPARQL och WIkishootme kan se vilka utegym som är nära mig men som saknar bild - funkar enormt bra att ladda upp direkt från mobil

Feedback jag fått*
När jag fotar utegym så försöker jag prata med folk nedan feedback

utegymmen används enormt lite
jag gillar utegym undanskymda i skogen
jag har haft eget kommersiellt gym och det skulle enkelt med några brädor gå att göra apparaterna bättre sp man kan variera vikter etc...

Answer 3 · 2022-09-09T08:45:59.000Z

@jonassodergren jag tror inte vi förstår hur mycket dialog som behövs... jag var med på ett Open Street Map event och då pratade man om Tag:access delivery dvs. med alla budjobb är det enormt viktigt att märka ut på husen vilken dörr budfirmor skall ta....

tror krav som detta kan man inte sitta i en vattenfallsspec och tänka ut... utan det måste vara agilt och communication communication communication som jag lyfta fram 2018 i Bonn

Min hemma filosof fundering är att detta måste systematiseras så vi inte får som för anslagstavlorna 290 smaker av kravinsamling...

tycker GITHUB där du kan referera Issues i andra repositories är lösningen.... men det finns säkert folk som ser problem...

Answer 4 · 2022-09-09T13:10:42.000Z

Såg att du visade att openstreetmap kan länka tillbaka till ett q-nummer i wikidata

@jonassodergren Det är där saker blir intressant att man ramlar över till 5-stardata OSM skriver bra om det / Key:wikidata / Why link to Wikidata?

Answer 5 · 2022-09-09T14:23:10.000Z

Gillar idén med QR-koder. Kanske en kod för att räkna besök, en kommun borde vilja se hur allmännyttiga platser används och hur de uppfattas.

Answer 6 · 2022-09-09T15:14:48.000Z

Japp feedback borde dagens teknik göra enklare i Holland fick cyklister en knapp på styret som dom tryckte på då dom uppfatta trafiksituationen jobbig.... liknande för astma... Stockholms stads pratskärmar... upplevd trygghet

Hade jag trott mer på nationella dataverkstaden hade jag föreslagit att dom skulle implementera något liknande QRpedia där telefonens inställningar avgör vilket Wikipedia språk du kommer till och dom genererar unika QRC koder...

se SkansenWikidata/issues/6 där jag tycker dom borde ha det på alla besöksskyltar

Answer 7 · 2022-09-09T15:32:38.000Z

jonassodergren commented 2 years ago

👍1

Answer 8 · 2022-09-09T16:20:02.000Z

Lång video om att koppla ihop med Wikidata, dataportalen, Scholia

POC hur man skulle kunna koppla dataportalen och Anslagstavlorna till Wikipedia

skapa Wikipedia konto
Visit your global.js page on Meta: User:/global.js jmf min global.js
Copy in the code:

mw.loader.load( '//meta.wikimedia.org/w/index.php?title=User:SuperHamster/view-it.js&action=raw&ctype=text/javascript' );  mw.loader.load( '//meta.wikimedia.org/w/index.php?title=User:Salgo60/scholia.js&action=raw&ctype=text/javascript' );
mw.loader.load( '//meta.wikimedia.org/w/index.php?title=User:Salgo60/anslagstavla.js&action=raw&ctype=text/javascript' );
mw.loader.load( '//meta.wikimedia.org/w/index.php?title=User:Salgo60/dataportalen.js&action=raw&ctype=text/javascript' );

En tanke hur strukturerad data skall kopplas till dataportalens dataset med samma som Wikidata, samma med Anslagstavlorna,......

Scholia finns idag med kopplingar mellan Riksdagens dokument ex. Öresundsförbindelsen, Anna Lindh
- Tanken med Scholia är att skapa "citation graphs" för vetenskapliga dokument där personer har ORCID och vetenskapliga dokument DOI
- mer om koppla Riksdagens dokument och det gamla Riksdagstrycket se Wikidata_riksdagen-corpus/issues/38#issuecomment-1229370127
Bilder finns idag i en Wikibase se video där bilderna har semantisk interoperabiitet med WIkidata

i videon finns fattigmans linked data med Chrome extension Entity Explosion / intro video
inspel på community.dataportal.se att Wikipedia skulle kunna kopplas ihop med Sveriges Öppna data set på dataportalen om vi börjar jobba med semantisk interoperabilitet
vid 4 min i videon pratar jag om semantiska utmaningar "kan en bro gå under vatten" se mer om detta ISWC keynote Jamie Taylor Google "Applied semantics: beyond the catalog"
- 13:46 airports - och knowledge panels - Power of Knowledge Graph: Interlocking data
- 18:53 Questions of Identity: Class Membership
- 20:16 Cinemas: are life sports films
- 21:00 Fire station - a firefighter... is an airport a fire station
- 21:35 Question of Identity: Entity Equivalence
- 25:46 "A little semantics goes a long way" James Hendler

Answer 9 · 2022-09-09T18:21:04.000Z

Bra POC. Det blir ju tydligt (om det inte var det innan) att en fritextsökning inte är optimalt för att "identifiera" ett dataset.

Answer 10 · 2022-09-09T18:27:30.000Z

Jag ska rådfråga någon som är duktig på specen. Men jag kollade lite fort: https://www.w3.org/TR/vocab-dcat-2/#Property:resource_identifier. Det ser faktiskt märkligt ut att en identifierare enbart finns på katalogen och inte specifika dataseten i katalogen. Ska undersöka det mer noggrant.

Answer 11 · 2022-09-09T19:18:14.000Z

Coolt

Jag har lyft frågan

med European Open Data portal varför dom inte gör som Google och har en kunskapsgraf se även JobTech forum där jag tog upp detta
- data.europa.eu team uppfattar jag säger att aktörer som DIGG inte har kompetensen... blir lite som hönan eller ägget...
och med svenska gänget 7 maj 2020

Answer 12 · 2022-09-09T19:30:40.000Z

Bra POC. Det blir ju tydligt (om det inte var det innan) att en fritextsökning inte är optimalt för att "identifiera" ett dataset.

Det som är snyggt är vetenskapliga dokument och Scholia där har man gjort hemläxan och infört DOI och ORCID... Google har ett bra dokument "Building Google Dataset Search and Fostering an Open Data Ecosystem"

Sedan är nog 100 miljarders frågan vad är optimalt gissar att det inte är B-laget hos Google som funderar hur saker skall struktureras och göras "findable"...

Steg 0 tror jag att vi får en öppen data vision som är gemensam.

Lyssnar jag på

"Kategorier av öppna data" så pratar man om textsträngar och några få kategorier, samma på [github.com/diggsweden/DCAT-AP-SE/issues/86(https://github.com/diggsweden/DCAT-AP-SE/issues/86)
mitt exempel med skolmaten nedan
att vi går från dagens massa legobitar i en hög till att ha en dialog om metadata och länkade data

och

Röran med Skolmat <-> dataportalen
Hur rörigt det blir med att flera kommuner lägger "dataset" som verkar peka på samma API för skolmaten se notebook

sedan

kallas dom olika, har eller inte har kategorier som verkar vara kommunens eget påhitt
vissa skickas bara med svenska namn och det blir en maskinöversättning eller inte
brist på DOI så man vet att det är samma "data set" på Europa portalen som svenska se samma önskan 2020 diggsweden/DCAT-AP-SE#72 (comment)

Fostra en community ;-) starta med DOI
Annan käpphäst är att starta med DOI se DIGGSweden/DCAT-AP-SE/issues/86# dvs. att samma dataset oberoende av i vilken portal det finns alltid har samma DOI så den som "skördar" aldrig tvekar - "Building Google Dataset Search and Fostering an Open Data Ecosystem"

Att starta med reconciliation

och även våga ta en dialog med dom som laddar upp vilket metadata dom anger

Jämför Google dataset search "Reconciling to the Google Knowledge Graph" se även video "The Google Dataset Search Engine"

Att ta ledarskap
Idag finns massa fina Livsmedels visioner men det känns inte som någon översätter detta till data som data. Det behövs en process och bygga upp kunskap vart vi vill och hur...

exempel livsmedel visionen och deras systemkarta

Answer 13 · 2022-09-10T05:04:36.000Z

Jo google har ett bra tänk såklart. Men jag tror att dataportalen.se räcker väldigt långt för Sverige om den börjar användas. Fler behöver nog bara kavla upp ärmarna och börja dela, och när man ändå delar så bör vi börja använda identifierare och tänka till lite på bästa format. Kritiken som lyfts på forumet kan kondenseras till dessa två punkter tror jag. Exempelvis https://www.dataportal.se/sv/datasets/180_5782/jobadlinks-jobbannonsfiler-annonser-jobtechlinks-2021-04-24targz är i format från schema.org och just google med flera är såklart intresserad av att indexera den informationen. Så det går att få dessa portaler att hänga ihop med små medel. I issuen ovan diskuteras kategorisering av dataset om jag förstår rätt, tänker att det inte löser problemet helt. Betrakta exempelvis https://www.dataportal.se/sv/datasets/180_6676/jobsearch-trends , det är id:t 180_6676 som är lite magiskt idag. Givet ett känt sätt att producera det id:t så borde det bli mycket enklare att börja koppla ihop dataseten som du efterfrågar.

Answer 14 · 2022-09-10T05:20:42.000Z

Det här inte lätt hur tänker du med datasets/180_6676/jobsearch-trends skall kopplas?

gissar man vill att detta skall sitta ihop med liknande dataset i Europa
- tanken svindlar om man kan koppla ihop detta med vad politikern beslutar om i olika länder se Datastory "Fork me: The version-controlled political party"
- se hur ML kopplar ihop data om olika skolor och brottslighet samma borde kunna göras med massa annat - "Predicting Arrests: Looking into Chicago’s Crime through Machine Learning
- fanns ett intressant case där man skulle använda vetenskapliga priser för att koppla ihop det med att utvärdera forskningen i olika länder se mina anteckningar T216409
- för ett litet språk som svenska gissar jag att Linked data med sitt språkoberoende även gör datat mycket mer användbart... och kan kopplas med andra dataset i världen....

Answer 15 · 2022-09-10T05:53:32.000Z

Delar din vision om vad som är möjligt om bara grunderna blir rätt. Källan till API:et ovan är https://data.jobtechdev.se/annonser/search-trends. I den mappen så finns även ett dcat-extrakt som beskriver datasetet. Det jag har svårt att få ihop är att id-numret till datasetet inte skapas av den som skapar datasetet. Tänker att det blir svårt att bygga kunskapsgrafer om den som tillhandahåller ett dataset inte kan länka till sitt egna dataset på ett förutbestämt sätt. Så jag är på en lite mer "basic" nivå än dig. =)

Answer 16 · 2022-09-10T06:15:33.000Z

Är inte DOI lösningen? tror inte man skall lita på att saker som dataportalen etc. finns för evigt....

jag är på en lite mer "basic" nivå än dig. =)

nja jag famlar enormt men Wikidata är lite kul eftersom det inbjuder till att testa nya saker...

Jag har inte blivit kompis med DCAT ännu tyvärr...

Answer 17 · 2022-09-10T06:37:49.000Z

Exempelvis DOI skulle kunna vara en lösning. Men aktören som tillhandahåller datasetet behöver börja skapa ett sådant id alt annan vettig beständig identifierare. Känns rimligt att det borde gå att beskriva i DCAT.

Answer 18 · 2022-09-10T07:27:41.000Z

Det är lite geggigt kollar jag på dct:identifier "https://data.jobtechdev.se/annonser/jobtechlinks/2022-03-04.tar.gz#about1" så är det inte trivialt att hitta den på dataportalen

enklast att hitta den var via google sökning site://data.europa.eu/data jobtech
sökning jobtechlinks 2022-03-04 ger annonser/jobtechlinks/2022-03-04.tar.gz och Data Europa EU data.europa.eu

Borde finnas ett mervärde att enkelt kunna hoppa mellan dom olika portaler i en perfekt värld så skulle det finnas kopplingar hos data.europa.eu till andra liknande dataset

sidan datasets/180_6143
- pekar inte på data.europa.eu ?!?!
- verkar inte visa dct:identifier se ttl
  - ttl filen har rdf:about
- klickar man på in English(övre högra hörnet) så skickas man till första sidan
- nyckelord visas men är inte klickbara
- har man infört ett eget begrepp ingångssida ?

Answer 19 · 2022-09-10T08:34:48.000Z

Precis, alla avser samma dataset, blir geggigt iom att inget unikt identifierar datasetet. Det är så uppenbart att det saknas att jag börjar fundera på om jag tänker fel på något sätt. =)

Answer 20 · 2022-09-10T09:20:41.000Z

Tycker Google AI blog uttrycker det bra "Building Google Dataset Search and Fostering an Open Data Ecosystem" Connecting Replicas of Datasets

Det antipattern jag tycker jag ser är att när tekniker snöar in i RDF syntax tappar man användarna och slutresultatet blir katastrof - gissar att dataportalen och ladda upp data känns komplext för dom som borde kunna den.... Denny som skapade Wikidata pratar ibland om att det skall vara lätt att göra rätt idag är det inte det... tips testa lek med Wikidata jag tycker dom lyckats ganska bra...

Tips2 Kolla lite på citation graphs där lyckas man med att vetenskapliga publikationer kan dyka upp på massa ställen och citera andra tidsskrifter som skrivits av andra gubbar

FREYA PID Graph

Annan intressant tanke är att ändringshistoriken skall kommuniceras

DOI: http://doi.org/10.5334/dsj-2019-054 "Proper Attribution for Curation and Maintenance of Research Collections: Metadata Recommendations of the RDA/TDWG Working Group"
- en sak jag funderar på är hur källor skall kopplas till TRUST, mina spretiga tankar och video fråga Wikidata Denny dvs. hur kan system A förstå kvaliten på datat från system B

"Proper methods of attribution (at the individual and institutional level) are very important for incentivizing digitization, mobilization, and sharing of data deriving from collections (physical and digital). One strategy for elevating the academic value of curatorial actions is to create the necessary infrastructure that captures the breadth of activities undertaken by curatorial staff. Several programs exist for aggregating metrics for research products other than publication"

SKOS - Simple Knowledge Organization System
ett annan utmaning är när saker inte är samma som men nästan då fungerar SKOS. Jag leker lite med det för Wikidata och Skansen se SkansenWikidata/issues/11

där typ av mappning = Property:P4390
- som kan ha
  - nära matchning / Q39893184
  - exakt träff / Q39893449
  - related match / Q39894604
  - bred träff / Q39894595
  - smal träff / Q39893967

Answer 21 · 2022-09-11T06:34:28.000Z

Frågan om tillit är intressant. Tycker ovan "affärsmodell" kunde användas mer för dataset https://arbetsformedlingen.se/platsbanken/annonser?s=2 (datakällan är ovan https://data.jobtechdev.se/annonser/jobtechlinks/2022-03-04.tar.gz). Myndigheten kan visa upp flera annonser för användaren, men samtidigt är det tydligt att myndigheten inte kan ansvara för annonsen som den länkar till. Just att länka till wikidata, youtube, andra myndigheters dataset blir mindre av en trustfråga om man faktiskt låter slutanvändaren vara med i bedömningen om de kan lite på informationen. Blir lätt byråkratiskt och en onödig överbyggnad om offentliga organisationer ska få bestämma vilken information som "får vara ihoplänkad".

Answer 22 · 2022-09-11T08:36:56.000Z

Bra POC. Det blir ju tydligt (om det inte var det innan) att en fritextsökning inte är optimalt för att "identifiera" ett dataset.

Japp vi måste bort från textsträngar så långt det går. "Things not strings"

Answer 23 · 2022-09-11T08:40:05.000Z

Japp tillit är viktigt när vi får detta att snurra

bekämpa fakenews (bra kommentar av WD Denny)
när vi har SBL i Wikidata sär är det en liten grupp på Riksarkivet av människor som inte ens alla svenska vet om (var den första WD egenskapen jag begärde skapad sep 2016)
det jag såg var när jag jobbade med Nobelpriset och Irak och Nadia_Murad det var ont om källor och jag hade ingen aning om deras kvalitet....
I WIkipedia finns en tanke att alla källor ligger i Wikidata och sedan refereras dom med mallar se mall Cite Q tyvärr är wikipedianer enormt tröga att tänka i nya banor så det används inte mycket
Jag tyckte vi skulle beskriva källor i WIkipedia så läsaren skulle kunna förstå vad man såg men ingen tyckte det var en bra ide se mitt exempel med SBL

En galenskap jag kanske ser komma är det jag ser med projektet Riksdagens corpus är att det saknas bra källor som är maskinläsbara på Riksdagsmän från Riksarkivet och KB fast dom jobbat i 400 år så då måste man välja Wikidata med alla dess fel och brister se welfare-state-analytics/riksdagen-corpus/wiki/

Skapade nyss en video hur mycket tid det tar att skapa kvalitet

i Wikidata har vi idag i princip alla Riksdagsmän se Project_every_politician/Sweden samma för hela världen Wikidata:WikiProject_every_politician
boken TvåKammarriksdagen är ett 5 bands verk med mycket hög kvalitet kopplar jag nu ihop med WD se Wikidata_riksdagen-corpus/issues/38 har en fil med 3500 gubbar som jag skall hitta i WD eller skapa dom

tror jag starta 2022 jan och har gjort hälften...se dialog med ML projektet

Answer 24 · 2022-09-11T08:45:44.000Z

Här är ett exempel på strings från Linköpings kommun:
"Exempel

GET /api/3/schools/nearby/?latitude=57.7840241562&longitude=14.2806602478 HTTP/1.1
Host: skolmaten.se
Client:

HTTP/1.1 200 OK

{
"schools": [
{
"id": 5023781168873472,
"name": "Smedbyns förskola",
"userDistance": 0.0
},
{
"id": 44707002,
"name": "Björnens förskola",
"userDistance": 0.17934306455811086
}
]
}
"
Noter: ingen identifikatorer på skolorna bara strängar.
https://www.linkoping.se/open/data/skolmat/

Answer 25 · 2022-09-11T09:05:58.000Z

exempel på strings från Linköpings kommun:

Video från 2022 jun

Det galna här är

detta textsträngs projekt starta 2015 med Örebro kommun och Björn H med Vinnova pengar
nya Vinnova pengar 16 miljoner 2018 i NSÖD och fortfarande textsträngar nu var Jan AInali med och prata med projektet men dom fatta nog inte vad han sa --> resultat textsträngar
som jag fatta så gjorde inte NSÖD så mycket blev lite pdf:er utan det hela drivs av leverantörer se deras GITHUB leta efter OpenMeal
jag skrev lite på dataportalen och skolmat och svinn

Lesson learned: är halvt omöjligt att få folk att inse vad Linked data är

Grundfelet man jobbar inte strukturerat utan i SÌLOS och alla har sin agenda att fakturera, visa upp sig, är rädda för förändring se hur skridskoklubbar jobbar

Answer 26 · 2022-09-11T09:31:35.000Z

Fattar. Men ovan sökning ger id på skolorna? Menar ni att id:et är internt och saknar innebörd?

Answer 27 · 2022-09-11T09:34:53.000Z

Det Magnus återkommer till ofta är DOI som är väldigt intressant. Är det fritt fram för vem som helst att börja utfärda dessa? Känns som att en organisation skulle förvalta utgivningen för alla myndigheter.

Answer 28 · 2022-09-11T09:50:07.000Z

DOI ... fritt fram för vem som helst att börja utfärda dessa

ingen aning men känns som ett DIGG uppdrag att ha dessa plus att som @dpriskorn tjatar ha en egen Wikidata

se Wikibase som EU kör

Answer 29 · 2022-09-11T09:54:44.000Z

Fattar. Men ovan sökning ger id på skolorna? Menar ni att id:et är internt och saknar innebörd?

Felet med skolmat är se Video från 2022 jun och Notebook - API endpunkt

att det står köttbullar som text sträng Livsmedelsverkets systemkarta visar att visionen är att man skall identifierar var maten kommer ifrån att
- dels skall maträtten ha identifierare
- alla ingridienser (gjordes av Jan AInali på ett event 2019 tror jag)
- alla leverantörskedjor skall identifieras och ha id
att skolan identifieras med en textsträng det finns nu identifierare som Skolverket och SCB underhåller se skolenhetskod WD Property:P7894

Se även*
exempel livsmedel visionen och deras systemkarta

Answer 30 · 2022-09-11T10:38:00.000Z

alla ingridienser (gjordes av Jan AInali på ett event 2019 tror jag)

Länk: Ainali/tastydata

Answer 31 · 2022-09-11T11:00:52.000Z

@jonassodergren jag skrev om gemensam datakatalog så vi hittar alla identifierare finns det planer?

Se https://community.dataportal.se/topic/120/eionet-data-dictionary

På Wikipedia med sin galna värld får vi mycket gratis men många bra design beslut har tagits

självklart att stödja alla världens språk
eftersom alla kan skriva
- självklart med att kunna rulla tillbaka
- självklart kunna jämföra versioner och ha versioner
- självklart att kunna diskutera på alla objekt
- självklart att egenskaper i Wikidata finns med kabel på olika språk
- självklart att kunna merga om August Strindberg på kinesiska råkar bli eget objekt
bra designbeslut
- Sparql så vi kan fråga Wikidata vore kanske bättre med graphql?!?!
- att skapa externa identifierare
- att skapa lexeme projektet
- osv.

Tror man borde göra som skridskoåkarna gör efter varje säsong sätta sig ned och fundera varför dataportalen är vad den är... tycker inte DIGG växt i rollen som digital expertmyndighet utan blir mer diskussionsgrupps poliser...

Answer 32 · 2022-09-11T13:37:55.000Z

Kanske vi kan införa ett användbarhetsindex för olika dataset? Där indexet baseras på datasetets uppfyllnad av, finns bra identifierare?, är fokus på things och inte strings, finns det ett känt format som skulle kunnat användas, är formatet öppet?, länkas det till relaterad information etc. Att bara diskutera de kriterierna är intressant, bedömningar kan ju med fördel göras av communityn alá wiki. @Ainali @salgo60 @dpriskorn

Answer 33 · 2022-09-11T14:51:48.000Z

Kanske vi kan införa ett användbarhetsindex för olika dataset?

Du menar typ 5 ★ OPEN DATA?

Answer 34 · 2022-09-11T15:06:35.000Z

Exakt. Men annan part än den som tillhandahåller datasetet behöver ju göra bedömningen och dokumentera resultatet var min tanke.

Answer 35 · 2022-09-11T16:02:12.000Z

Men annan part än den som tillhandahåller datasetet behöver ju göra bedömningen och dokumentera resultatet var min tanke.

Behövs det verkligen? Skalan är ju ganska enkel och lätt att förstå och en myndighet lär ju knappast ljuga i sin självbedömning.

Answer 36 · 2022-09-11T16:22:59.000Z

Bara en idé. Vilken självbedömning?

Answer 37 · 2022-09-11T16:32:52.000Z

Bara en idé. Vilken självbedömning?

Om femstjärnemodellen införs som ett användbarhetsindex på Dataportalen som ett obligatoriskt fält så blir det uppladdarens (vilket i de allra flesta fall också är myndigheten som producerar datasetet) självbedömning.

Answer 38 · 2022-09-11T17:02:58.000Z

Jag tror det är bra med att enkelt kunna dela erfarenheter och/eller var projekt finns som använder ett visst data set..

Kanske sätta upp en Wiki där man kan beskriva problem/önskningar vore bra. Tycker vi hittar hela tiden nya saker i dataset som borde dokumenteras... idag då de flesta inte har en backlog förrsvinner den erfarenheten...

Det utkast jag gjorde på hur jag uppfattar Riksarkivet SBL som är en extremt trovärdig källa men enormt skitigt data som dom är långsamma att rätta...

https://sv.wikipedia.org/wiki/Anv%C3%A4ndare:Salgo60/Source:SBL

Tycker vi ser med Riksdagens data massa saker som bör dokumenteras. När Riksdagen själva saknar en yta för detta kan en wiki vara bra

dom säger själva att dom kommer ha den nya identifieraren i sitt data för alla Riksdagsmän WD proposal - Property:P8388
- lesson learned finns massa data där bara det gamla finns med Property:P1214
konstig titelsättning på gamla dokument se video
- lesson learned Motionerna från 70-talet har ibland rätt kass ocr

Answer 39 · 2022-09-11T19:19:44.000Z

Jag gillar idén med att bedöma myndigheterna hur de överlag klarar av att dela öppen länkad data.
Då är det bara 600 bedömningar totalt.
För varje datamängd skalar inte bra, vi är för få engagerade konsumenter.
Kanske om man hade en recessionsmöjlighet på dataportalen för varje datamängd att de skulle kunna få vettig återkoppling.

Answer 40 · 2022-09-11T19:21:58.000Z

För varje datamängd skalar inte bra, vi är för få engagerade konsumenter.

Enda sättet att få det att skala är att göra det ett krav för att få publicera, för då finns det någon som har som arbetsuppgift att göra det.

Answer 41 · 2022-09-12T04:51:59.000Z

För varje datamängd skalar inte bra, vi är för få engagerade konsumenter.

Enda sättet att få det att skala är att göra det ett krav för att få publicera, för då finns det någon som har som arbetsuppgift att göra det.

Håller med men då betyder det att alla lagdelar måste fungerar. Idag ser vi bara gegga och vi saknar styrning som användare mistral pekar på och då måste vi runda detta...

Samma problem med skalning har vi i Wikidata hela tiden men eftersom det nästan aldrig fungerar så blir det massa merarbete i Wikidata och verktyg som Wikidata:Mismatch_Finder tas fram för att runda dysfunktionella system. Exempel vad vi ser

brist på versionshantering källsystemen
brist på helpdesknummer hos källsystemet
brist på spårbarhet mellan Wikidata och källsystem då det uppstår problem
....

Tycker min analogi att myndigheter/kommuner/arkiv... bör vara lika funktionella som proffsiga skridskoklubbar och nedanstående modell är bra... tycker dom flesta vi kommunicerar med är på Level 1 "Process unpredictable, poorly controlled and reactive" --> vi kan inte lita på dom, vi kan inte spåra vad dom gör utan det är en process lika tillförlitlig som att säga till en tonåring att städa sitt rum ;-)

--> vi måste runda detta och skapa ett "mellanlager" som alla kan uppdatera... vi har testat dagens system som bygger på att organisationerna själva tar ansvar och bygger upp egen kompetens sedan innan 2013 som du vet video min slutsats dom gör inte sin arbetsuppgiften och vi lider av att dom är på nivå 1 Level 1 "Process unpredictable, poorly controlled and reactive"

@Ainali du som varit med på hela resan vad talar för att det skall fungera 2022...? Jag tycker jag ser denna galenskap hela tiden

utegym jag skapar 1300 utegym med spec och data på en vecka.... det specas 6 månader inget utegymsdata samlas in eller den data som skapas i ÖDIS projektet uppdateras inte och läggs i ett system som stängs ned efter 2 år
Rättsinformationssystemet några 1000 författningar skall samlas in från 100 myndigheter med lite strukturerad data... efter 15 år kommer man på att man inte är kompetent och avbryter aktiviteten trots att SFS 1999:175 säger att man skall leverera
....

Answer 42 · 2022-09-12T05:23:53.000Z

För varje datamängd skalar inte bra, vi är för få engagerade konsumenter.

Enda sättet att få det att skala är att göra det ett krav för att få publicera, för då finns det någon som har som arbetsuppgift att göra det.

Håller med om att det enda skalbara och långsiktiga alternativet är att den ansvariga självskattar och redovisar. Min poäng var nog att dels tar det väldigt lång tid (många år) att införa. Går det att prova och se om det skulle tillföra något för låt säga 10 organisationers separat av användarna och inte producenten? Fungerar det inte så fungerar det inte. Fungerar det så är det enklare att skala upp en sådan MVP.

Answer 43 · 2022-09-12T06:44:58.000Z

Håller med men då betyder det att alla lagdelar måste fungerar.

Det behövs inga lagändringar för att lägga till ett fält i formuläret på Dataportalen. Inga av de andra fälten finns definierade i lagtext. Det här kan DIGG göra i eftermiddag om de vill.

Answer 44 · 2022-09-12T19:07:46.000Z

lagändringar = rätt personer i laget , inte lagtext.... lag hjälper inte när organisationer är dysfunktklnella och saknar ledarskap/vision se Rättsinformationsprojektet och 15 års uthållighet resultat 0

DIGG laget idag sitter och funderar i 4 månader om dom kan ändra en timeout på diskussionsgruppen, dom kan inte ge oss unika helpdesk id:n... enormt rädda.... utan vision.... när jag lyssnade på DIGG i Almedalen verkar dom bara vilja vara kompisar och bli fler...

Answer 45 · 2022-09-13T14:35:58.000Z

För varje datamängd skalar inte bra, vi är för få engagerade konsumenter.

Enda sättet att få det att skala är att göra det ett krav för att få publicera, för då finns det någon som har som arbetsuppgift att göra det.

Håller med men då betyder det att alla lagdelar måste fungerar. Idag ser vi bara gegga och vi saknar styrning som användare mistral pekar på och då måste vi runda detta...

Samma problem med skalning har vi i Wikidata hela tiden men eftersom det nästan aldrig fungerar så blir det massa merarbete i Wikidata och verktyg som Wikidata:Mismatch_Finder tas fram för att runda dysfunktionella system. Exempel vad vi ser

brist på versionshantering källsystemen

brist på helpdesknummer hos källsystemet

brist på spårbarhet mellan Wikidata och källsystem då det uppstår problem

....

Tycker min analogi att myndigheter/kommuner/arkiv... bör vara lika funktionella som proffsiga skridskoklubbar och nedanstående modell är bra... tycker dom flesta vi kommunicerar med är på Level 1 "Process unpredictable, poorly controlled and reactive" --> vi kan inte lita på dom, vi kan inte spåra vad dom gör utan det är en process lika tillförlitlig som att säga till en tonåring att städa sitt rum ;-)

--> vi måste runda detta och skapa ett "mellanlager" som alla kan uppdatera... vi har testat dagens system som bygger på att organisationerna själva tar ansvar och bygger upp egen kompetens sedan innan 2013 som du vet video min slutsats dom gör inte sin arbetsuppgiften och vi lider av att dom är på nivå 1 Level 1 "Process unpredictable, poorly controlled and reactive"

Håller helt med om detta. Det är nog inte dumt med ett buffertlager nu när det är såhär kasst jämt. De får helt enkelt rycka upp sig och städa i eget hus om de ska få vara med i världsklass (i WD).

Levererar de inte så gör de inte det. Då ska man tydligt kunna se vad vi vill ha och vem som klarar av det. På vandringsleder är det 1/290 kommuner vad jag har hittat hittills som klarar av att leverera ett minimum av kvalitet.

Jag tycker vi ska bilda en ny demokratisk ideell organisation för datakonsumenter som bildar opinion på området och ger kudos/pris till dem som faktiskt levererar. Då kan vi fråga tripadvisor, google, öppna Skolplattformen, m.fl. om de vill vara med.

Vi kan vara konkreta med vad vi önskar av myndigheterna och samordning och tvärsektoriell styrning för att faktiskt kunna få till ett vettigt öppen data ekosystem.

Nu har vi ju ett trasigt ekosystem och en massa huvudlösa höns som inte styrs av någon som är tydlig på regeringsnivå. Intresset i politiska partier för öppen data verkar vara lågt. Det skulle vi kunna jobba mera målriktad med också.

Answer 46 · 2022-09-13T14:43:51.000Z

Jag tycker vi ska bilda en ny demokratisk ideell organisation

Om du vill slippa det administrativa med driva en organisation känns det som att det är verksamhet som skulle kunna inkluderas i antingen CivicTech Sweden eller Open Knowledge Sweden.

Answer 47 · 2022-09-13T15:02:34.000Z

Jag hade en timmes snack med Jonas StorStockholm och saker som ramlade ut

kan vi jaga ihop en Vandringsleds spec 0.1 StorsthlmWIkidata/issues/5 dvs. fortsättning på #2 cc: @dpriskorn jag tror vi kan ha olika nivåer av "compliance"
- version 0.1 AllTrails-ID (P7127)
behov av begrepps/termkatalog StorsthlmWIkidata/issues/4
behov av Datatourism - kan franska omtologin vara en väg framåt StorsthlmWIkidata/issues/3
hur man jobbar med SKOS och relationer exempel hur vi försöker jobba semantiskt med Skansen salgo60/SkansenWikidata#11

Answer 48 · 2022-09-13T16:08:59.000Z

Kan tipsa om https://www.swedishjobtech.se/ (angående värdförening) som har mycket erfarna projektledare och som verkar för öppna data på ett väldigt positivt sätt. De kanske kan vara intresserade av denna dialog. Uppmärksammar de på denna tråd.

Answer 49 · 2022-09-13T17:17:50.000Z

Trevligt det "problem" jag fastna i med Jobtechs data och yrken SSYK var att det blev så komplext...

https://phabricator.wikimedia.org/T262906

Answer 50 · 2022-09-14T07:59:50.000Z

Apropå arbetsgivare och grafer och länkar så har jag förstått att bolagsverket tar betalt för sin data delvis för att finansiera Svenska akademin (som för övrigt också underpresterar i mina och Magnus ögon för de har skitig data)
Det finns alltså inte någon öppen datamängd att skapa en graf utifrån.
Med andra ord så kommer du få väldigt svårt att länka ihop om inte du först pratar med regeringen och ber dem fixa så datan bliver fri.
Bolagsverket är bunden enligt lag att betala 16 mio årligen till SA så det behövs en lagändring. Kanske skulle kungen själv börja finansiera sin fina akademi framledes? 😉
Kolla hur det ser ut i Norge och Danmark på området. Hur offentliga är företagsdata där?

Answer 51 · 2022-09-14T18:34:58.000Z

Tack @jonassodergren för att du pingade oss i Swedish JobTech. Vår ambition är att driva på inom området datadriven matchning, i vid bemärkelse. Vid gör det genom kontakt med politiker och andra personer i myndigheter, företag, organisationer etc. Och vi gör det genom att anordna olika slag av event. Vi har också med hjälp av ett av "våra" startup-företag, https://www.assedon.se/ och data från SCB och TIllväxtverket tagit fram matchningskollen.se Vi tar gärna emot tips och idéer om vad vi skulle kunna göra mer inom vårt område. Eftersom vi arbetar ideellt har vi blygsamma ekonomiska resurser att använda. Kolla gärna på vår sajt swedishjobtech.se vad vi har på gång.

Answer 52 · 2022-09-15T06:27:00.000Z

Vår ambition är att driva på inom området datadriven matchning, i vid bemärkelse. Vid gör det genom kontakt med politiker och andra personer i myndigheter, företag, organisationer etc. Och vi gör det genom att anordna olika slag av event.

Skrik till om ni vill ha kontakt @Sjolars

jag har skrivit ihop en Magnus list vad man skall uppfylla för att vara bra att koppla ihop med Wikidata
1-1) mycket bra video av en enormt skarp utvecklare på Stanford zoom som går igenom den listan vid 26:39 min
Exempel saker jag gör
2-1) Nobelprize.org notebook - där gjorde vi om hela deras länkmodell för att det var så mycket länkröta... dom har nu samma som Wikidata se litteraturpristagaren https://api.nobelprize.org/2.1/laureate/1004

2-2) webscrapar Riksarkivet SBL eftersom dom saknar API - skapar samma som Wikidata egenskap P3217 - detta startade 2016
jag har säkert lagt flera manmånader på detta hade gått snabbare att skriva ett API till dom- blog om SBL i WD

pratade om detta på Linked data Sweden April 25, 2019 video min 13:25
kopplat personer som detta till Norra Begravningsplatsen = 839 stycken / Uppsala Gamla begravningsplats

Spotify SBL Norra begravningsplatsen

2-3) Notebook som kollar Svenskt Kvinnobiografiskt lexikon dom har API men fattar inte Linked data pratade på deras stygruppsmöte 2020 slides
2-4) En snabb koll på Historiska yrke i olika databaser och konstatera hur dåligt det är och en inbjudan till massa aktörer att jobba ihop... lesson learned dom föredrar SILOS

2-5) Litteraturbanken där litteraturbanken använder Wikidata för att länka Riksarkivet etc... det tragiska här att dom länkar Wikidata mer än Kungliga biblioteket.... se notebook status. Jag har försökt ha en dialog med Kungliga biblioteket om att jobba ihop mer men funkar inte dom vill vara en SILO se video fråga till KB 2018 dec med bra svar av Niklas men 2022 ser vi inget hänt

liknande fråga på event i Bonn jag flög ned till Bonn där 5 personer från KB var med och min tanke var att nu finns ett nytt system LIBRISXL då kan saker börja hända men men men dom är trötta och rädda...
GITHUB önskan om att se om vi kan jobba ihop med Kungliga biblioteket LIBRISXL och ha mer samma som... deras enda reaktion är att en utvecklare hör av sig på Telegram "anonymt" och vill prata men också att dom vill inte att vi kritiserar systemet.... gissar att ingen internt gillar det... nedan försök att få fart på LIBRISXL - internet archive med en diskussionsgrupp dom stängde ned efter för mycket kritik, exempel semantisk koppling, KB ej har koll på copyright, kommentar om att LIBRISXL drivs oproffsigt utan backlog.

IA "Litteraturbanken <-> LIBRIS <-> WD #1015" org https://github.com/libris/librisxl/issues/1015
IA "Kvalitetskontroll? Finns wikifunktionalitet?" org https://github.com/libris/librisxl/issues/1019
IA "Dags att utvärdera om ni ska skrota LibrisXL och använda Wikibase istället?" org https://github.com/libris/librisxl/issues/1018
IA "Wikidata and merge issues #1017" https://github.com/libris/librisxl/issues/1017
IA "Support for english #1014" org https://github.com/libris/librisxl/issues/1014
samma fråga 10 Jun 2018 om engelska menyer IA länk till forum LIBRISXL stängt ned efter för mycket kritik

2-6) jag gör en aktivitet med Skansens data salgo60/SkansenWikidata och lite lite med @AnnaKarinSkansen där bland annat jag försöker få dom att fundera över SKOS

2-7) kopplat ihop Runstenar och i vilka böcker i Litteraturbanken dom beskrivs på se salgo60/Litteraturbanken_wd_runes skrev ett papper om hur dataroundtripping med bilder kan fungera med Wikicommons som har strukturerat data för bilder video och pratade på LD4 2021 om det video
2-8) Svenska badplatser där jag kopplar Wikidata med havsmyndigheten och EU bad - samma som fungerar dåligt se DIGG forum, samma aktivitet med utegym.... anledningen var att något hittepå projekt med statliga pengar som bara satt och speca... så jag specade i 15 min och samlade in 1300 utegym på en vecka... nu har fler personer på Wikipedia börjat lägga till bilder och utegym. Endast Stockholms stad har bra API se #99 och video feedback jag gjorde / #114.

2-9) Svenskt Porträttarkiv så har en gubbe scannat 800 000 bilder och tror jag 500 000 bilder på hus.... jmf 90 museer som lagt upp 2 miljoner bilder på 10 år på Digitalt museum.... vi kopplar samma som WD och hämtar in deras bilder se projektyta för javascript som fixar bildhämtning

2-10) Webscrapar Svenska Akademin och skapar samma som Wikidata med en egenskap jag begärde skulle skapas

2-11) Wikidata är dom som har bäst koll på historiska Riksdagsmän --> när ML forskare skall göra om Riksdagstrycket så länkar dom WD se mer info

2-12) POC koppla böcker om kyrkor till Wikidata och bok om Riddarholmskyrkan till personer i boken se salgo60/SamlaLibris

2-13) Kopplat ihop Svenska församlingar med Wikidata, Riksarkivet - websida

2-14) Koppla kommuners sidor om medborgarförslag till Wikidata, anslagstavlor och WIkibase.cloud

2-15) Koppla ihop hembyggdsföreningar med WIkidata

2-16) Bokförlaget Kriterium.se lärde dom att skapa poster i WIkidata websida

se deras aktivitet i Wikidata

2-17) old Dashboard e.g. Connect 160 000 artist in Europeana with WD lesson learned they send text strings = #metadatadebt

2-18) tittade även på hur Esam publicerar dokument utan maskinläsbar metadata. Inser då att i lagrummet saknas författningssamlingar --> att jag synade ett havererat projekt Rättsinformations systemet som under 15 år försökt få 100 myndigheter att i maskinläsbar form publicera sina författningar, 2015 gav man upp det som starta 1998 i en 160 siders förstudie Ds 1998:10

Datastory och WD user @miroli har kopplat ihop enormt mycket dels Riksdagsdokument men även skolenheter

Datastory Skolenheter
WD Property:P7894
"How we're tracking elections in symbiosis with Wikidata"
relaterad grej dom gör om att versionshantera politik "Fork me: The version-controlled political party"

Answer 53 · 2022-09-15T06:45:00.000Z

Tack Magnus, //Lars

…

------------------------------------------------------------------------- Lars Sjöström Tel: +4670 575 96 36 Stråkvägen 50, SE 191 43 Sollentuna, Sweden e-post: ***@***.***> ***@***.***; ***@***.***> ***@***.*** Från: Magnus Sälgö ***@***.***> Skickat: den 15 september 2022 08:27 Till: salgo60/ProjectOutdoorGyms ***@***.***> Kopia: Sjolars ***@***.***>; Mention ***@***.***> Ämne: Re: [salgo60/ProjectOutdoorGyms] Kunskapsfråga - (out of context) (Issue #120) Vår ambition är att driva på inom området datadriven matchning, i vid bemärkelse. Vid gör det genom kontakt med politiker och andra personer i myndigheter, företag, organisationer etc. Och vi gör det genom att anordna olika slag av event. Skrik till om ni vill ha kontakt @Sjolars <https://github.com/Sjolars> 1. jag har skrivit ihop en Magnus list vad man skall uppfylla för att vara bra att koppla ihop med Wikidata 1-1) mycket bra video av en enormt skarp utvecklare på Standford zoom som går igenom den listan vid 26 min 2. Exempel saker jag gör 2-1) Mobelprize.org notebook - där gjorde vi om hela deras länkmodell för att var så mycket länkröta... 2-2) webscrapar Riksarkivet SBL eftersom dom saknar API 2-3) Notebook som kollar Svenskt Kvinnobiografiskt lexikon 2-4) En snabb koll på Historiska yrke i olika databaser och konstatera gur dåligt det är och en inbjudan till massa aktörer att jobba ihop.... lesson learned dom föredrar SILOS 2-5) Litteraturbanken där litteraturbanken använder WIkidata för att länka Riksarkivet etc... det tragiska här att dom länkar Wikidata mer än Kungliga biblioteket.... 2-6) jag gör en aktivitet med Skansens data salgo60/SkansenWikidata <https://github.com/salgo60/SkansenWikidata> och lite lite med @AnnaKarinSkansen <https://github.com/AnnaKarinSkansen> 2-7) kopplat ihop Runstenar och i vilka böcker i Litteraturbanken dom beskrivs på se salgo60/Litteraturbanken_wd_runes <https://github.com/salgo60/Litteraturbanken_wd_runes> skrev ett papper om hur dataroundtripping med bilder <https://meta.wikimedia.org/wiki/Structured_data_for_GLAM-Wiki/Roundtripping/KMB> kan fungera med WIkicommons som har struktureragt data för bilder video <https://www.youtube.com/watch?v=lmWmMIuCJVM> och pratade på LD4 2021 <https://ld42021.sched.com/> om det video <https://www.youtube.com/watch?v=GeDXzInR_mA> 3. Datastory och WD user xxxx har kopplat ihop enormt mycket dels Riksdagsdokument men även skolenheter — Reply to this email directly, view it on GitHub <#120 (comment)> , or unsubscribe <https://github.com/notifications/unsubscribe-auth/A3CJZDOWEI5KUKUPHCM2RK3V6K6T7ANCNFSM6AAAAAAQIKY7YQ> . You are receiving this because you were mentioned.Message ID: ***@***.***>

-- Det här e-postmeddelandet har genomsökts efter virus av Avast-antivirusprogrammet. www.avast.com

Answer 54 · 2022-09-15T06:55:46.000Z

@Sjolars Skrik till vad ni vill ha jag uppdaterar mitt inlägg med lite fler länkar.....

En användare @SchermanJ gör en cool grej som @Ainali startade med att koppla Riksdagens dokument till ämnesord se Kopplingssprint

jag testade EU API SDGMapper för att se om vi kunde koppla Hållbarhetsmålen till partiernas löften och till motioner i Riksdagen se yta github.com/salgo60/SDGMapperSweden
- diskussion med dom om att ha Hållbarhetslöftena samma som UN SDG
Hade bra möte 2019 där Riksdagen sa att dom fundera på att ha ämnesord från Eurovoc som idag finns i Wikidata Property:P5437 men inget har hänt det är lite lite verkstad hos Riksdagen....

@Ainali försöker samla in alla världens myndigheter i Wikidata --> vi kommer då ha persistenta identifierare vilket jag tror är ett enormt lyft se twitter govdirectory
ännu snyggare är en användare som kopplat HD domar till Wikidata och kan se vilka domare som dömmer i domar som dom varit med i att ta fram lagen.... se tweet / video om detta

Answer 55 · 2022-09-22T13:38:11.000Z

Tack Magnus, //Lars

@Sjolars Skrik till vad ni vill ha jag uppdaterar mitt inlägg med lite fler länkar.....

En användare @SchermanJ gör en cool grej som @Ainali startade med att koppla Riksdagens dokument till ämnesord se Kopplingssprint

jag testade EU API SDGMapper för att se om vi kunde koppla Hållbarhetsmålen till partiernas löften och till motioner i Riksdagen se yta github.com/salgo60/SDGMapperSweden

diskussion med dom om att ha Hållbarhetslöftena samma som UN SDG

Hade bra möte 2019 där Riksdagen sa att dom fundera på att ha ämnesord från Eurovoc som idag finns i Wikidata Property:P5437 men inget har hänt det är lite lite verkstad hos Riksdagen....
@Ainali försöker samla in alla världens myndigheter i Wikidata --> vi kommer då ha persistenta identifierare vilket jag tror är ett enormt lyft se twitter govdirectory

ännu snyggare är en användare som kopplat HD domar till Wikidata och kan se vilka domare som dömmer i domar som dom varit med i att ta fram lagen.... se tweet / video om detta

I fallet med motionerna har vi nu strax över 32 000 motioner med ett huvudtema. I fallet med Trafikutskottet är det över 5000 motioner, och cirka 43 % av det totala som har ett ämne. Det börjar bli användbart och möjligt att se vilja ämnen och frågor som är de mest intressanta för ledamöter att driva.