Service menu

Gratis værktøjer til den analytiske journalist

Der er masser af data og tal på nettet, som hurtigt kan blive til gode historier. Kåre Kildall Rysgaard underviser i foråret på 2-dages kurset "10 hotte værktøjer til den analytiske journalist", og giver dig her det første værktøj - helt gratis.

 

Værktøj nr. 1: Helium Scraper: Tøm nettet for information helt uden at programmere

Det vrimler med interessante oplysninger på nettet: Lister med læger, der arbejder for medicinal industrien. Oversigter over hvilke fødevarer, der bliver trukket tilbage på grund af sundhedsfare. Ranking af skoler og meget mere. Af og til er det dog en umulig opgave at få fat i oplysningerne, hvis man manuelt skal klippe og klistre dem sammen fra et hav af hjemmesider. Her er det handy automatisk at kunne indsamle informationerne med en webscraper.


Helium Scraper er en af de mest intuitative og effektive værktøjer til webscraping for journalister og er blevet rost af journalister på New York Times. Der er ingen programmering, og forholdsvist hurtigt kan man indsamle imponerende mængder at information.

Hvordan gør man?

Programmets brugerflade er nemt at finde rundt i. Med en markør klikker du på de elementer, som du er interesseret i at få fat i. Hvis du for eksempel gerne vil have adresser på virksomhederne på en oversigtsside med en tabel, klikker du først på alle adresser og definerer, at de hører sammen. Derefter klikker du måske på kontaktpersoner og fortæller, at det er kontaktpersoner. Når du har defineret, hvad du gerne vil gribe fat i, opsætter du programmet. Helium Scraper drøner så gennem op til tusindvis af lignende hjemmesider og indsamler de oplysninger, du søger. Til sidst har du fanget alle data og kan gå i gang med at se på tendenser og trends. Nu er der gode muligheder for en solohistorie, for sandsynligvis har ingen andre journalister samme oplysninger.

Hvad er det mere præcist for informationer, Helium Scraper hjælper dig med at samle?

Jeg har blandt andet brugt Helium Scraper til for Ugeskrift for Læger at kortlægge, hvor gamle lægerne er i hver kommune, og hvem der er kvinder og mænd. Alle oplysninger ligger på Sundhed.dk, men man skal slå hvert lægehus op enkeltvis. Det er en umulig opgave. For DR har jeg også udtrukket en liste med problematiske fødevarer og for A4 har jeg brugt Helium Scraper til at indsamle tweets fra folketingspolitikerne.

I hvilken form samler den informationerne, og er de så lette at bearbejde derfra?

Alle oplysninger kommer ud som en almindelig regneark fil. Er man vant til regneark, er det bare at gå i gang med at sortere data og lave analysen derfra.

Selvom man ikke behøver at programmere, er det så ikke et program, der kræver lidt for-forståelse for at kunne betjene?
Selve brugerfladen er enkel. Det drejer sig om blot at klikke på de elementer på en hjemmeside, som man ønsker at få fat i. Hvis man skal lave avancerede tømninger af hjemmesider, skal man dog tænke sig lidt mere om - og også holde tungen lige i munden med hensyn til, hvad de forskellige funktioner i programmet kan.

Kan du give eksempler på historier, der er blevet til med brug af Helium Scraper?

Jeg har lavet flere baggrundsartikler til blandt andet A4, hvor Helium Scraper har været brugt. For eksempel kunne jeg ved en opsamling af Twitter-beskeder vise, at politikerne hellere ville tale om melodi grand prix på sociale medier end om EU afstemning. Jeg har også tømt EU´s udbudsdatabase. Data kunne efter en analyse afsløre, at virksomheder, der havde dårligt arbejdsmiljø ifølge Arbejdstilsynet alligevel vandt mange kontrakter for de offentlige. Der var også en sidehistorie om, at de virksomheder der vinder kontrakter, ofte befinder sig i nærområdet.

I næste uges nyhedsbrev får du endnu et gratis værktøj på denne side.
 
Du kan stadig nå at tilmelde dig kurset, hvis du gerne vil have de sidste otte værktøjer. Kurset foregår i Aarhus den 18.-19. maj. Læs mere om kurset her.
 

Prefooter web-form

Foreslå indhold til underskoven

Underskoven

Opdatér Type the characters you see in this picture. Type the characters you see in the picture; if you can't read them, submit the form and a new image will be generated. Not case sensitive.  Switch to audio verification.

Instagram

  • Presentation of innovation solution to the client 
_
#dmjx #dmjxx16 #addingvalue #technology
  • Presentation of three weeks of work on an innovation project. Client presentation
_
#dmjxx16 #dmjx #technology #addingvalue
  • Presentation time. 
_
#dmjxx16 #dmjx #addingvalue #technology
  • Presentation to the client. All groups had interesting concepts that improves the clients product with a way to connect with people baked in.
_
#dmjxx16 #dmjx #addingvalue
  • Presentation time. Groups are presenting their solution to the client. I loved that all groups improved the clients product in a big way. 
_
#dmjx #dmjxx16 #presentation #addingvalue #bringonthechange #usingtechnology #technology
  • Typisk Nakskov #dmjx #rustur
  • Så der galla #dmjx #kk
  • ma bestie 💁🏻🍸 #dmjx #rustur #vscocam #vsco