Datadonderdag editie10

Page 1

DATA DON DER DAG #10 Beurs van Berlage Damrak Amsterdam 19/ 11 / 15


ORGANISATOREN Mark van Rijmenam, Rob Dielemans en Rutger Wetzels

PARTNERS

MEDIA PARTNERS

2

Data Donderdag


PROGRAMMA KICK OFF

MARK VAN RIJMENAM

SPREKER 1

PIEK VOSSEN Hoogleraar Computationele Lexicologie aan de VU

SPREKER 2

HYLKE NIERMEIJER Achmea ERIK KENTIE Easim, initiatief TU Delft

SPREKER 3

MARCEL VAN DER KUIL MedTech Professional en CEO SensoRun

SPREKER 4

NIEK TEMME Business Analytics Consultant – DeltIQ Group

STARTUP PITCH BERT BÖEKLING & MARK VAN HATTEM Oprichters Whatifolution

Editie #10

3


4

Data Donderdag


Editie #10

5


AAN HET WOORD MARCEL MANK

“Ik kom hier uit pure interesse. Op het moment iets noemen uit de presentaties waar ik wat aan heb voor mijn werk bij het datawarehouse van het UWV is lastig. Dat komt wellicht morgen onder de douche.”

6

Data Donderdag


SARA WESTPHAL

“Ik vind het interessant om te horen waar mensen mee bezig zijn op het gebied van Big Data. Maar meer tijd voor interactie op zo’n avond als deze zou fijn zijn.”

ROB HOFSTRA

“Als student data science ben ik al eerder bij Data Donderdag geweest. Ik vind de avonden gezellig, interessant en een goede gelegenheid om contacten te leggen.” Editie #10

7


KICK OFF Mark van Rijmenam Mede-organisator van Data Donderdag en Oprichter Datafloq

Voor de videopresenatie, klik hier.

8

Data Donderdag


“Dit is de enige meetup over Big Data zonder technische details.�

Editie #10

9


PIEK VOSSEN

HOOGLERAAR COMPUTATIONELE LEXICOLOGIE AAN DE VU Sentimentanalyse van teksten heeft vaak twee mogelijke uitkomsten: positief of negatief. Maar het analyseren van teksten is ingewikkelder. Om een tekst goed te kunnen begrijpen dien je met meer zaken rekening te houden, door bijvoorbeeld te kijken naar vanuit welke context de tekst is geschreven, en wat de achtergrond van de schrijver is. Alleen sentimentanalyse geeft niet goed weer wat mensen met een tekst willen zeggen. Daarom werken wij met een onderzoeksgroep van twintig man aan de ontwikkeling van software die teksten in verschillende talen kan lezen en kan interpreteren wat er echt staat.

Mening en advies

Bedrijven zijn geïnteresseerd in meningen van mensen, voor bijvoorbeeld productfeedback, marktanalyse of concurrentieanalyse. Maar ook voor de politiek en landen is het interessant om te weten hoe mensen reageren op dingen die ze uitspoken. Daarnaast is ieder persoon zelf geïnteresseerd in wat anderen vinden, bijvoorbeeld als je op zoek bent naar een vakantie, naar stemadvies of medisch advies. Er is een enorme industrie rondom sentimenttechnologie. Maar veel meer dan het leveren van een dashboard waarop aangegeven wordt of het sentiment positief of negatief is, is het vaak niet. Eigenlijk

10

Data Donderdag

weet je dan nog niks. Je moet dieper in de mening duiken. Waarover gaat de mening, maar ook wie is de persoon die de mening geeft, wat is zijn achtergrond, welke emotie heeft hij, waarom geeft hij een mening, wanneer is de mening gedeeld en wat is zijn relatie met hetgeen waar de mening over gaat.

Combineren kun je leren

We nemen een review van een hotel als voorbeeld. Er staat heel veel informatie in, positief en negatief. Er worden verschillende hotels benoemd. Uit deze review kun je niet zomaar een mening halen. Hij staat vol met subtiele sentimenten, sommige zijn esthetisch, sommige hebben te maken met ervaring, hygiëne en comfort. Deze factoren kun je ordenen. Dat is wat wij gedaan hebben, wij hebben relaties geëxtraheerd. Dat noemen we supervise learning. Je begint bijvoorbeeld met het woord ‘nice’. In een grote verzameling reviews ga je op zoek naar het woord nice, met de woorden ‘and cheap’. Dan zoek je in combinatie met ‘service’ en ‘food’. Tussen die woorden bleek een relatie te zijn. Ondertussen kom je weer andere opiniewoorden tegen. Vervolgens rank je alle woorden en kom je erachter welke elementen mensen belangrijk vinden als ze ergens een mening over vormen.


“Het analyseren van reviews is ingewikkeld. Duitsers en Engelsen drukken zich bijvoorbeeld subtieler uit dan Nederlanders en Spanjaarden. Daar moet je rekening mee houden.�

Editie #10

11


Hierna hebben we gekeken naar reviews die de schrijver in zijn moedertaal geschreven heeft zijn. Uit de analyse bleek dat Engelsen en Duitsers meer uitgesproken zijn bij het geven van een rating, maar in hun tekst drukken ze zich subtieler uit dan bijvoorbeeld Nederlanders en Spanjaarden. Dus als je reviews gaat analyseren neem je dit mee, om erachter te kunnen komen hoe ontevreden of tevreden iemand nu eigenlijk is.

Voor de presentatieslides, klik hier. Voor de videopresenatie, klik hier.

12

Data Donderdag


Editie #10

13


HYLKE NIERMEIJER

ACHMEA

ERIK KENTIE

EASIM, INITIATIEF TU DELFT

In 2015 is de TU Delft een initiatief gestart met verzekeraar Achmea, met de focus op schade. Vier groepen studenten van twintig man zijn aan de slag gegaan, met als doel data op verschillende manieren te benaderen. In relatief korte tijd werd veel informatie uit data gehaald. Er zijn diverse modellen op losgelaten, die resultaten gaven over inbraken, verkeersongevallen en waterschade. In 2016 gaat de TU Delft verder met groepen studenten, waarnaast de universiteit nog op zoek is naar cases. Op het gebied van schade is Achmea de grootste verzekeraar van Nederland. Er komen jaarlijks één miljoen schadeclaims binnen. Daarmee hebben we een ongelooflijk rijke bron aan data over wat iemand in zijn omgeving kan overkomen. Omdat de wereld om ons heen verandert, willen we daar op inspelen. Van oudsher weten wij hoe we met data om moeten gaan. We verzamelen historische gegevens en passen statistieken toe om risico’s te delen. Steeds meer, en op andere manieren, proberen we data te ontsluiten. Bijvoorbeeld om schadebedragen te voorspellen en directe uitbetaling mogelijk te maken. In potentie levert dat veel snellere en klantvriendelijkere processen op. Een toepassing waar we nu mee bezig zijn is een enorme bron schadedata in

14

Data Donderdag

een bepaalde context plaatsen. Echte mogelijkheden zien we op termijn in de hoek van veilig rijden en veilig en comfortabel wonen. We hebben bijvoorbeeld een case gedaan met straatverlichting. In een bepaald gebied werden alle verkeersongevallen gerelateerd aan de hoeveelheid verlichting. Dat leverde zogenaamde heatmaps op, hierop zijn punten te zien waar slechte verlichting is of veel ongelukken gebeuren. Als een dergelijk overzicht per stad of zelfs landelijk te maken is, is dat een grote sprong voorwaarts. Vervolgens kun je in gesprek gaan met gemeenten over maatregelen. Uiteindelijk kan dit leiden tot betere verlichting en daardoor minder ongevallen. Een ander voorbeeld: na een grote wolkbreuk kunnen wij goed zien waar schades vallen. Als deze data gecombineerd wordt met data van het waternet, over bijvoorbeeld de staat van de riolering, kunnen er relaties gelegd worden. Is de riolering van invloed op de heftigheid van een overstroming? De uitkomst hiervan kan voor ons een reden zijn om met een gemeente te gaan praten.

Voor de videopresenatie, klik hier.


“Het is een logische weg om in de toekomst met data mensen een veiligere leefomgeving en veiligere rit naar huis bieden.�

Editie #10

15


MARCEL VAN DER KUIL

MEDTECH PROFESSIONAL EN CEO SENSORUN

Data Science lijkt mainstream te worden. Elk bedrijf moet tegenwoordig een data scientist aan boord hebben. Er moet iemand zijn die naar data kijkt en er betekenis aan kan geven. Een andere trend is Real World Data: data die mensen over zichzelf in het dagelijks leven vastleggen en die mogelijk willen delen met bijvoorbeeld verzekeraars. Nog een trend is PortableWearable-Implantable. Dat wat we nu dragen – bijvoorbeeld een smartphone of medische apparaten – gaat het lichaam in en levert data op. Mijns inziens bieden deze ontwikkelingen op het gebied van Big Data kansen, om bijvoorbeeld gedrag van mensen of dieren te beïnvloeden en daarmee een blijvend effect te creëren. De datakwaliteit en modelkwaliteit moet dan wel goed zijn, zo moet het bijvoorbeeld volgens de wetgeving en geldende moraal gaan en er is visie en creativiteit nodig.

Waarschuwen en coachen

Ik zag paar jaar geleden een duidelijk verband tussen wetenschap en de sport die ik beoefen: hardlopen. Wat wilden wij nu doen als startup? Onze expertise ligt in sensorgebaseerde metingen, kijken naar hoe het lichaam beweegt en hoe we daarop persoonlijke feedback kunnen geven. Wat wij graag willen is mensen kennis over hardlopen aanreiken, zodat er een soort veiligheidsgordel ontstaat. Zie

16

Data Donderdag

het als een soort coach in je smartphone, die aanwijzingen kan geven en feedback over hoe je het doet. Als we hardlopen kunnen we een enorme hoeveelheid data genereren. Daar wordt tot nu toe weinig mee gedaan, maar hoe zou het nu zijn als we bijvoorbeeld gewaarschuwd worden voor blessures door toepassing van deze data?

Uitdaging

We zagen drie uitdagingen: lopers die nu starten raken sneller geblesseerd dan voorheen, en stoppen veel eerder. Hardlopen wordt populairder, extremer en trekt mensen aan die niet goed weten wat ze doen. Apps en gadgets zijn tegenwoordig een must voor veel lopers, ook al lijken de meeste lopers niet met deze data overweg te kunnen. Onze conclusie was: voor veel mensen is hardlopen lang nog niet zo leuk. Dat willen we verbeteren. Hoe kun je iemand laten genieten van hardlopen en er ook nog eens voor zorgen dat hij of zij dit langer volhoudt door bijvoorbeeld blessures te voorkomen? Er zijn ontzettend veel hardloop-apps en die door een groot aantal wordt gebruikt. Deze geven je echter alleen basisfeedback. Het lijkt niet op wat een goede coach zou doen en dat mogen wij best als teleurstellend benoemen. Die apps geven geen antwoorden op vragen zoals: ben ik klaar voor een marathon? Innovatie is


“Wat wij graag willen is mensen kennis over hardlopen aanreiken, zodat er een soort veiligheidsgordel ontstaat.� Editie #10

17


dus nodig! Er zullen apps moeten komen die hier mogelijkheid toe bieden en beschikbaar worden gesteld voor de massa. Dat is ons doel!

Het einddoel

Op dit moment laten wij lopers met meetapparatuur lopen. De sensoren zitten in het pak en in de schoenen. In de rugzak van de loper zit een tablet die data ontvangt. Door data op deze manier te analyseren kunnen we zien wanneer de vermoeidheid toeslaat en welke ledenmaten overbelast raken. Biomechanische bewegingspatronen creëren, gedurende de inspanning, dat is de business case. Het einddoel is een ‘next gen running app’ die in real time laat zien hoe jij beweegt en hoe dat eruit ziet. Onze kennis markeert waar het niet goed gaat, bijvoorbeeld in vele knieën. Doordat al deze data geleverd wordt kunnen wij volgend jaar met topsport beginnen. Coaches kunnen direct aan de slag. De app is er nog niet, maar uiteindelijk moet die voor iedereen beschikbaar worden en gratis zijn.

Voor de presentatieslides, klik hier. Voor de videopresenatie, klik hier.

18

Data Donderdag


Editie #10

19


20

Data Donderdag


Editie #10

21


NIEK TEMME

BUSINESS ANALYTICS CONSULTANT – DELTIQ GROUP De slimme thermostaat zien we steeds vaker. Maar een thermostaat die zelflerend is met de hulp van big data is er nog niet. Die heb ik een gemaakt.

Analyseren met een doel

In december 2014 ben ik in mijn eigen huis met het project gestart. Ik wist niks van cvketels, alleen dat de ketel die wij hadden, ouderwets was. Ook had ik geen idee hoe een thermostaat werkte. Dat wilde ik dus eerst leren. Ik heb een hub aangesloten op de thermostaat die voor mij data naar de cloud stuurde zodat ik de verzamelde data kon analyseren. Ik wilde duizend waardes per seconden verzamelen. In een jaar leverde me dat 800 gigabyte aan data op, en dat was slechts voor één persoon. Door compressie heb ik dit met 90 procent naar beneden kunnen halen. Het laatste stukje was de analyse. De data gaf mij inzicht hoe de thermostaat werkte. Ik kwam erachter dat de cv-ketel standaard zes keer per uur werd aangezet. Als de temperatuur in huis hoger moest worden, werd de ketel langer aangezet. Hierin ontdekte ik een bepaald patroon: de eerste keer dat de ketel werd ingeschakeld, werd het huis zes minuten verwarmd, vervolgens vijf minuten en zo verder. Mijn doel was om achter het meest efficiënte patroon te komen om een kamer

22

Data Donderdag

te verwarmen, dan wel de temperatuur gelijk te houden. Ook door gebruik te maken van gegevens over de binnen- en de buitentemperatuur. Misschien was het efficiënter om de cv-ketel één keer heel lang, of juist meerdere keren gelijkmatiger in te schakelen. Uiteindelijk leerde mijn thermostaat dat het efficiënter kon dan standaard was. Dus werd mijn verwarming energiezuiniger.

Eindresultaat

Het belangrijkste dat ik geleerd heb van mijn project, is dat, voordat ik startte, ik heel goed moest nadenken over hoeveel waardes ik wilde verzamelen. Dat is namelijk bepalend voor het algehele eindresultaat.

Voor de presentatieslides, klik hier. Voor de videopresenatie, klik hier.


“Uiteindelijk leerde mijn thermostaat dat het efficiënter kon dan standaard was. Dus werd mijn verwarming energiezuiniger.” Editie #10

23


24

Data Donderdag


Editie #10

25


STARTUP PITCH

BERT BĂ–EKLING & MARK VAN HATTEM - OPRICHTERS WHATIFOLUTION Whatifolution gaat verder waar andere dashboards stoppen. In een visuele, dynamische omgeving wordt data gegenereerd of bewerkt met je vinger en zie je direct resultaat. Alles communiceert interactief met elkaar. Ons model werkt vanuit resultaat, in plaats van steeds de inputwaarden aan te passen.

e-

Uitkomst en input

Veel bedrijven doen aan scenarioanalyse: wat zijn de gevolgen van beslissingen die je neemt. Iedereen werkt echter met Excelmodellen en die kennen fouten. Wij hebben bedacht dat je in plaats van de input aan te passen, je het resultaat en de uitkomsten als input neemt. Wat als je bijvoorbeeld winst als uitgangspunt neemt, welke invloed heeft dat dan op het besluitproces? Data die in ons model gaat, resulteert in een uitkomst, maar die uitkomst kun je ook gebruiken als input. Je kunt heen en weer rekenen naar wat je wilt. Je kunt iedere uitkomstparameter als inputparameter gebruiken en het resultaat wordt direct visueel weergeven. Stel je wilt een investering doen in een bedrijf, wat kun je dan het beste doen? Wat betekent dat voor het rendement op je vermogen? In ons model kun je met je vinger de omzet omhoog trekken en kun je direct zien, wat hiervan de invloed is op je

ROI. Trek bijvoorbeeld de omzet omhoog, dan neemt ook ROI toe. Het model geeft antwoord op een vraag als: Wat nu als ik meer ga investeren, wat gebeurt er dan met de ROI? Twee jaar geleden hebben we voor een Amerikaanse relatie het begrotingsprobleem inzichtelijk proberen te maken. Het model wat we ontwikkeld hebben biedt de mogelijkheid om aan de parameters van te begroting te kunnen trekken. Als je bijvoorbeeld aan de inkomsten en de verplichte en nietverplichte uitgaven trekt zie je meteen het gevolg op begrotingstekorten. Het is een voorbeeld van hoe de technologie in elkaar zit.

De kracht van

De kracht van Whatifolution is dat het je kan helpen om op een eenvoudige manier beslissingen te nemen. Het is een geavanceerde rekentechnologie die gemakkelijk inzicht kan geven in complexe situaties. Wij zien eindeloze toepassingen, bijvoorbeeld in de financiĂŤle wereld, maar ook elders.

Voor de presentatieslides, klik hier. Voor de videopresenatie, klik hier.

26

Data Donderdag


“De kracht van Whatifolution is dat het je kan helpen om op een eenvoudige manier beslissingen te nemen.�

Editie #10

27


28

Data Donderdag


Editie #10

29


AAN HET WOORD SUSANNE SCHERER

“Voordat ik persoonlijke data af zou staan aan bedrijven zoals verzekeringsmaatschappijen vind ik het belangrijk om te weten wat ermee gebeurt en hoe ik er vervolgens van kan profiteren.”

30

Data Donderdag


JOS VAN DONGEN

“Ik kom bijna naar elke Data Donderdag. De onderwerpen bijzonder gevarieerd, leerzaam en interessant.”

RIEKE SMAKMAN

“Als advocaat ben erg nieuwsgierig naar de impact van data-analyse binnen mijn vakgebied. Hoe het toegepast kan worden op bewijslevering en pleidooien in civiele procedures.” Editie #10

31


32

Data Donderdag


Editie #10

33


Kijk op www.datadonderdag.nl voor meer info of mail naar info@datadonderdag.nl Voor de presenaties van deze edities, klik hier. Voor de videopresenaties van deze edities, klik hier.

We zien je graag op de volgende Data Donderdag! 11E EDITIE DATA DONDERDAG: 28 JANUARI

34

Data Donderdag


COLOFON Visuele Notulen Anouk Verbruggen - Magazine Design Anouk Verbruggen- Editor William Koster - Live stream Pieter Beekmans - Teksten Amar Inderdjiet - Fotografie Simon Hagenaars - Illustratie Web: www.visuelenotulen.nl Mail: info@visuelenotulen.nl Tel: 026-2022178

Editie #10

35



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.