8-11-2017
Met Twitter op zoek naar stank - NEMO Kennislink
Met Twitter op zoek naar stankoverlast Interactieve kaart toont probleemgebied Auteur: Malini Witlox
Het gebruik van locatie- en tijdgebonden data is niet langer alleen voorbehouden aan slimme marketeers, die willen weten hoe lang een klant in een winkel blijft. Ook de overheid heeft sociale media en de smartphone ontdekt als bron van informatie. Zo hebben de DCMR Milieudienst Rijnmond en Arcadis Twitter gebruikt om illegale lozingen op te sporen en daarover informatie te vergaren. Twitter is een digtale klaagmuur, zeker in Nederland. We zeuren overal over: de harde muziek van de buren, vertraagde treinen, werkzaamheden en vast ook over stank. Daar moeten we wat mee, dachten ze bij Arcadis en DCMR en dus benaderden ze Andreas Wombacher en Maurice van Keulen, onderzoekers van de universiteit Twente, gespecialiseerd in Data Management Technology. “De Milieudienst Rijnmond heeft een meldkamer waar onder meer telefoontjes van mensen binnen komen, maar waar ook informatie van sensoren wordt gebruikt om bijvoorbeeld het weglekken of vervliegen van schadelijke chemicaliën te detecteren”, legt Van Keulen uit. “Mensen bellen echter niet meer als er iets aan de hand is, dus moet je op een andere manier met de burger in contact komen. Daarom wilden ze sensorinformatie koppelen aan tweets van mensen die klagen over stank. Zo hoopten ze problemen eerder op het spoor te komen. Ook is het mogelijk om, als ze de meldingen in plaats en tijd kunnen volgen, terug te kijken in de historie en te Keek Mix, Maurie van Keulen, CC BY-SA 1.0 achterhalen waar een probleem (http://wwwhome.cs.utwente.nl/~keulen/wor ontstond. De milieudienst zet deze dpress/contact/) technologie dan ook in voor allerlei zaken, bijvoorbeeld om via Twitter vervuild oppervlaktewater door illegale lozingen op te sporen.”
Stank Twitter maakt het mogelijk om tweets automatisch van een GPS-locatie te voorzien. Een makkelijk dataproject, denk je misschien. Even die locatiemetadata filteren en je ziet bijvoorbeeld alle tweets over Rotterdam-Noord. Was het maar zo simpel, aldus Van Keulen. Iedereen kiest er zelf voor om die GPS-functie aan te zetten en slechts twee procent van de mensen heeft dat ook daadwerkelijk gedaan. Zonder de https://www.nemokennislink.nl/publicaties/met-twitter-op-zoek-naar-stankoverlast/
1/3
8-11-2017
Met Twitter op zoek naar stank - NEMO Kennislink
locatie van de tweets kun je ze niet op een kaart tonen en niet filteren op Rotterdam-Noord. En aan stanktweets uit New York heeft de DCMR natuurlijk niet veel. De onderzoekers besloten daarom naar de inhoud van de tweet te kijken voor het bepalen van de locatie waarover iemand stank rapporteert. “Maar iedereen beschrijft een locatie op heel verschillende manieren: met straatnamen, bijzondere gebouwen, markante landschapselementen enzovoorts. Die moeten allemaal meegenomen worden. Ook gebruikt niet iedereen dezelfde woorden voor stank.”
Miljoenen tweets Hiervoor is een pilot opgezet. Er werden lijsten opgesteld met dergelijke woorden om tweets te identificeren en te filteren. Ook werd naar tweets over historische lozingen en andere gebeurtenissen gezocht. Op basis van de Twitterdata wordt “In de gevonden berichten werden een heat map samengesteld. In een oogopslag is duidelijk waar de dan weer nieuwe woorden gelezen die problemen zich bevinden. aan de lijst werden toegevoegd,” Universiteit Twente, Arcadis verklaart Van Keulen. Bottleneck bij (https://www.youtube.com/watch? het project: mensen bleken veel v=9Qv7F_43dOk) minder dan verwacht over zaken als stank te twitteren. Waarschijnlijk omdat ze denken dat er toch niets met die melding gedaan werd. Daarom veranderde DCMR van aanpak en ging diverse burgers actief benaderen of ze bewust wilden gaan twitteren. Hoe visualiseer je de meldingen en klachten op een kaart van het gebied? De onderzoekers wilden een interactieve kaart ontwikkelen die vanuit grote hoeveelheden data, exacte geaggregeerde informatie toont en snel genoeg update voor vloeiend inzoomen en in plaats en tijd kan verschuiven. Van Keulen maakt de vergelijking met Buienradar. “Daarbij zijn de buienplaatjes vooraf berekend, maar in ons project kon je dus real-time de meldingconcentraties van stank voorbij zien trekken.” Data aggregatie is een proces waarin informatie wordt verzameld en uitgedrukt in een gebundelde vorm. Arcadis heeft een eigen omgeving ontwikkeld genaamd Atrium om dergelijke geografische applicaties te maken. “Ze gebruiken daarbij open source GIS-software (Geographic Information Systems) en open source databases zoals PostgreSQL. Daarmee is het mogelijk om thematische informatie, zoals bijvoorbeeld hoeveelheden meldingen of tweets, op een kaart te visualiseren.” Met GIS-software kunnen ruimtelijke gegevens of informatie over geografische objecten, worden opgeslagen, geanalyseerd en gepresenteerd. PostgreSQL is een databasemanagementsysteem, onder meer geschikt voor Linux en Windows. Een complex probleem bij het zoomen en verschuiven op een kaart en de analyse van miljoenen tweets is het behoud van snelheid. Van Keulen: “Alles vooraf berekenen is niet mogelijk, maar alles direct berekenen is te traag. En afhankelijkheid van specialistische databasetechnologie is voor partijen als Arcadis commercieel niet interessant. Daarom hebben we zelf een nieuwe technologie ontworpen die als een plugin aan een open source database als PostgreSQL toegevoegd kan worden.”
Prefab
https://www.nemokennislink.nl/publicaties/met-twitter-op-zoek-naar-stankoverlast/
2/3
8-11-2017
Met Twitter op zoek naar stank - NEMO Kennislink
Van Keulen legt uit dat het een nieuwe indexstructuur is speciaal voor het versnellen van het berekenen van geaggregeerde informatie. “Je kunt het vergelijken met prefab in de bouw. Huizen worden tegenwoordig niet meer ter Arcadis heeft een eigen omgeving plekke helemaal van de grond af ontwikkeld met de naam Atrium. gebouwd, maar hele wanden met Daarin zien ze geografisch ramen en deuren worden aangevoerd. weergegeven waar zich een Die zijn vooraf in de fabriek gemaakt. probleem voordoet. De onderdelen zijn slim ontworpen Arcadis om in verschillende gebouwen gebruikt te worden. Onze indexstructuur is ook zo ontworpen zoddat bepaalde stukjes voorberekend worden zodat die slim voor meerdere zoom-niveaus ingezet kunnen worden. Op deze manier bereken je met normale open source technologie toch direct exacte geaggregeerde informatie, snel genoeg voor vloeiend inzoom en verschuiven.” De onderzoeker benadrukt dat je ook bij andere projecten baat hebt bij deze indextechnologie. “In principe kan elke applicatie waarin thematische data gevisualiseerd wordt in plaats en tijd hiermee worden versneld. Met subsidie vanuit het Commit-onderzoeksprogramma (https://www.nemokennislink.nl/partners/commit) hebben we de onderzoeksresultaten verder uitgewerkt tot robuuste software, met een heldere uitleg en demonstraties. Daarmee wordt het niet alleen voor Arcadis, maar ook voor andere bedrijven mogelijk de software te gebruiken.” Dit artikel is een publicatie van NEMO Kennislink. © NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 23 september 2016
https://www.nemokennislink.nl/publicaties/met-twitter-op-zoek-naar-stankoverlast/
3/3