Web scraping med gratis redskaber

På dette kursus lærer du at skrabe data fra nettet og lave historier, du ikke har kunnet lave før. Du programmerer din egen web scraper, som du kan bruge tilbage i dit arbejde.

Derfor skal du tage kurset

Web scraping er et nyttigt første skridt på vej ind i robotjournalistikkens mange muligheder. Web scraping går ud på at trække data ud af hjemmesider ved hjælp af simpel programmering og samle det overskueligt, f.eks. i regneark. Web scraping kan blandt andet bruges til at samle data om boligmarkedet, om sportsresultater eller om virksomheder. Og alle kan lære det.

På kurset downloader og installerer deltagerne gratisprogrammerne Python, Beautiful Soup og Selenium på deres egen computer og lærer den smule programmering, der skal til for at kunne web scrape. De lærer også om hjemmesiders HTML-opbygning for at finde de oplysninger, man skal bruge.

Kurset vil indeholde eksempler på web scraping samt konkrete opgaver. Deltagerne lærer, hvordan man på denne måde kan hente store mængder data fra fx offentlige myndigheders hjemmesider, som det vil være for besværligt og tage for lang tid at klikke sig frem til selv.

På dette kursus lærer du, at:

  • At forstå principperne og mulighederne i web scraping
  • At web scrape med Python og Beautiful Soup
  • At web scrape sites, der benytter JavaScript og AJAX med Selenium

Med dig hjem får du:

  • Software til web scraping af forskellige typer web-sider
  • En web scraper, du selv har programmeret

Kurset er for dig

Kurset er særligt udviklet til journalister, der arbejder på et medie eller i en virksomhed og producerer datakrævende historier.

Deltagerne behøver ikke at have særlige tekniske forkundskaber, men gerne en forståelse for principperne i web scraping og idéer til historier, de vil lave med web scraping.

Sådan foregår undervisningen

Kurset varer tre dage og er meget praktisk orienteret. Deltagerne går igennem trinene i web scraping i fællesskab og bruger deres egen computer, så de kan fortsætte med programmerne, når de kommer tilbage til arbejdet.

De vil også få præsenteret flere eksempler på brug af web scraping til inspiration for deres egne historier.

 

På kurset møder du

Tore G. C. Rich

Tore er journalist og webudvikler samt administrerende direktør hos InfoDroids, der beskæftiger sig med webudvikling og web scraping. Han er tidligere områderedaktør hos Frederiksborg Amts Avis (2010-2018) og ekstern underviser/projektvejleder i journalistik på Roskilde Universitet. Tore er uddannet cand.comm i journalistik med socialvidenskab som andet fag på Roskilde Universitet, har været i praktik hos Ritzaus Bureau og har et diplom i procesledelse fra DMJX.

Prefooter web-form

Foreslå indhold til underskoven

Underskoven

Instagram