23.1.07

Tjek ”Many Eyes”: Cool IBM-forskning

Orlando: Jeg har lige fået et smugkig på et interessant stykke software, der gør det hundelet for masser af folk at danne sig et indtryk af relevante statistikker og indbyrdes at diskutere, hvad man ser eller undres over. Tjenesten hedder Many Eyes, og den er ved at forlade vuggen, der stod på IBM forskningslaboratorium i Cambridge ved Boston.

Tag et kig på det. Om du er minister (især hvis du er det) eller menigmand. Many Eyes handler nemlig om at gøre statistikker lette at forstå og selv arbejde videre på. Det handler om visualisering af data. Man kan vælge nøjagtig den graftype, der fungere bedst for en selv (14 typer at vælge iblandt). Man kan udforske disse data, kommenterer dem og måske tilsammen med en masse andre finde frem til særligt interessante ting, være det sig tendensen, forklaring på afvigelser eller spørgsmål, som nogen vitterlig skylder en forklaring på. IBM selv betegner det som ”demokratisering” af data.

Jeg så et eksempel med USA’s nationalregnskab – fordelen af udgifter til militær, sundhed etc. etc. Klikkede nærmere ind på militæret og så kurven toppe ved tiden, hvor Vietnam-krigen rasede, og nu ved Irak-krigen. Og så var Ronald Reagan generelt set en dyr mand, regnet i militærudgifter.

Undres man over en udvikling et sted på kurven, kan man bare klikke på Comments og stille sit spørgsmål. Måske vil andre svare. Ved spørgsmålet bringer Many Eyes i øvrigt pr. automatik også grafbilledet markeret med, hvor ens cursor (pegepilen) stod på kurven, så andre ved nøjagtigt, hvad der udløste spørgsmålet eller kommentaren.

Umiddelbart kom jeg til at tænke på alle de gange, det offentlige derhjemme præsenterer et budget, og ikke en levende sjæl uden for politiker- og embedsmandskredse gider sætte et øje på det. Selv når der er forsøg på at involvere borgere i diskussioner om tallene via nettet, får de måske et par kommentarer, men ellers rungende tavshed.

Luk for fejltolkninger

For mange tal krøller hjernen på de fleste. Også derfor er der frit spil for ”oversmarte” partsfortolkninger af tal, gemt dybt i informationsmængden, og det tager hulens tid at få udsagn frem om, hvorvidt det er fup eller fakta. Ingen menigmand har en chance for selv lige at tjekke tal og tendenser.

Masser af andre tal vil det være relevant at kunne give mange folk et enkelt indblik i og mulighed for at diskutere. Både om samfundet som sådan, om et ministerielt territorium og om forhold internt i en virksomhed, omend der her næppe er offentlig adgang.

Du kan selv opbygge hele datagrundlaget, eller du kan bruge andres (og tjekke, hvem der har oprettet det, og kilderne som data kommer fra).

IBM stiller Many Eyes gratis til rådighed via et web-sted. Men det åbnes først om godt en halvtime - omkring kl. 20 dansk tid, så klik ikke ind før. Lænken er her. Måske går webstedet i knæ, hvis der kommer for mange besøgende her på åbningsdagen, men så kig ind senere.

Kære Helge og Bertel,
Så kære Helge Sander, du der så gerne vil fremme unges interesse for naturvidenskab og teknologi. Læg statistikker ind for uddannelser, livsindkomst og hvad med livslængde afhængig af erhverv. Læg også lige nogle tal ind for forskningsbudgetterne, så menigmand kan tjekke, om det er sandt eller falsk, at der er puttet flere penge i forskning eller færre.

Bertel Haarder! Der må være masser af tale om budgetter til skoler, klassekvotienter, uddannelsesstatistikker etc. etc., som skolefolk og alle andre, kan vandre rundt i og checke.

Lars Løkke Rasmussen kan lægge masser af tal fra sundhedssektoren ind. Penge til sygehussektoren, fordeling på klinikere og administratorer med videre. Tal for sygdomme og helbredelser – her kan Kræftens Bekæmpelse også lægge data ud til medlemmer og alle andre, der måtte ønske at tjekke tendenser og diskutere dem.

Det var altså min umiddelbare reaktion på dette stykke forskningsarbejde. Lad mig høre, hvis du har en anden holdning. Eller måske bud på, hvad der også burde lægges ind.

5 kommentarer:

codegirl.dk sagde ...

Fedt! Men der er fri adgang til statistik om Danmark på http://www.statistikbanken.dk/ så folk kan jo bare gå igang med at lægge på, der er ingen grund til at vente på at politikerne skal gøre det.

Jacob Packert sagde ...

Hej Dorte Toft,
spændende blog du har - jeg er begyndt at abonnere på dit feed efter jeg hørte dig i P1's program, Kaffeklubben.


Hvad angår statistisk, så ville jeg umådeligt gerne se det omtalte værktøj benyttet på alle danske arbejdsmarkedsstatistikker. Fordeling på erhverv, demografi, etc, men ledighed, arbejdsløshed, antal danskere i aktivering, på dagpenge, langtidsledige etc.

Netop disse statistikker er interessante, fordi de er så uigennemskuelige; det er svært at finde ud af, hvor lav ledigheden i Danmark er, for man ved ikke, om man taler om langtidsledige, invalidepensionister, folk i aktivering, eller andet.
Så alle de statistikker ville jeg gerne se analyseret og kommenteret af flere øjne i Danmark.
Tak for introduktionen til Many Eyes :-)

Mvh Jacob Packert

Dorte Toft sagde ...

@ codegirl, jacob og alle andre,
Giv endelig lyd, hvis I selv får skabt noget interessant på Many Eyes. Så vil jeg også skrive om det på bloggen om det.

Men det er jo nok ikke helt så ligetil med de helt tunge ting, som Jakob efterlyser. Mon ikke der er masser af eksempler på, at der er ændret beregningsmetode hen ad vejen etc. etc.
Dorte
PS: Og tak for de pæne ord Jacob

Anonym sagde ...

Ugh... Man kunne måske godt frygte at for megen statistik-eksponering for den almindelige dansker ikke nødvendigvis gavner noget som helst, da den slags ofte skal læses med et gran salt (og altid med solid viden om statistiske metoder, dataindsamling m.m.)
Ofte sker der jo det i mediedebatten at nuancerne og de mindre let-fordøjelige forklaringer på forskellige statistikker drukner i letkøbte one-liners.

Jeg læste for nyligt dette citat:

"Statistik er som en god bikini. Den viser meget, men skjuler det væsentlige."

;-)
Kenneth

Anonym sagde ...

Det hjælper da altid når data bliver præsenteret godt og med gode muligheder for opstilling. MY er et fint system. MEN - det fritager ikke for at have basal viden - eller lidt mere - når man skal gå ind i vurderinger af grafisk statistik. Den klassiske misvisning er at "strække" spændet mellem enhederne i en graf's X- eller Y værdier, så fx. en negativ udvikling flades mere ud. Og man kan ikke sammenligne kartofler og æbler uden at sat sig ind i hvordan man egentlig skal forholde sig til en sådan sammenligning. Derfor er det også bare eksotiske forestillinger at man f.eks. kan plotte alle militærdata ind - og så få et vorherres overblik over hvad der forgår. Det er lige som et horoskob: alle kan let lære at beregne et - men det tager årtier at lære at tolke. !