Veilig opgroeien door machine learning

Het project ‘Datagestuurd preventief werken’ ontwikkelt een model om problemen bij gezinnen op tijd te identificeren of zelfs te voorkomen.

“Een zorgprofessional of leraar heeft vaak een onderbuikgevoel, maar weet dat gevoel niet precies te onderbouwen”, vertelt Patricia Prüfer, projectleider bij CentERdata. “Samen met Sterk Huis, gemeente Tilburg en Data Science Centre van Tilburg University zoeken wij naar de onderbouwing van dat gevoel.”

Diverse bronnen

“We hebben een lijst van indicatoren die een potentieel onveilige situatie voor kinderen voorspellen. De achterliggende data van deze indicatoren verzamelen we bij verschillende bronnen: gemeente, CBS, GGD, GGZ, leerplichtambtenaar, politie, scholen en eerdere onderzoeken. Door de data te onderzoeken met hulp van machine learning, willen we de giftige cocktail van risicofactoren opsporen.” 

Patricia Prüfer, projectleider bij CentERdata: “Wees transparant, open minded en deel je kennis. Op weg naar de perfecte data scientist!”
credit Marion van de Wiel

De grootste uitdagingen van het onderzoek blijken praktisch van aard. “Iedereen is enthousiast, iedereen steunt het onderzoek. Maar als je om de gegevens vraagt, vindt men ze toch te gevoelig om beschikbaar te stellen, ook al is de aanpak niet op persoonsniveau maar op wijkniveau”, vertelt Prüfer. Wat ook blijkt: de datakwaliteit is lang niet altijd optimaal. Prüfer adviseert: “Zoek de juiste contacten met bevoegd­heden om data te delen, reserveer veel tijd voor gesprekken en voorlichting, zorg voor een hoger aggregatieniveau als data anders niet gedeeld mogen worden. Bovendien, om data steeds bruikbaarder en het model steeds beter te maken, moet je de professionals die met een registratiesysteem werken, trainen. En wees transparant en deel je kennis, zo kweek je vertrouwen.” 

Lerende keten

Eind dit schooljaar moet de pilot het eerste voorspellingsmodel opleveren. “We willen interactieve sessies organiseren met beleidsmedewerkers, leerkrachten en ouders. Door de vraag te stellen: “Herkennen jullie wat de analyses opleveren?”, kan het model waar nodig bijgesteld en verbeterd worden. We zien het onderzoek als één levend systeem van data producenten, analisten en eindgebruikers, de hele keten is lerend”, aldus Prüfer. 

Kansen data science

Uiteindelijk is het doel om het model op landelijk niveau uit te rollen. Prüfer: “Vaak zien onderzoekers maar ook zorgprofessionals alleen wat ze al kennen. Zoals een huisarts die ontkent dat er sprake is van huiselijk geweld onder patiënten van zijn praktijk. Data science combineert bestaande informatie en biedt dus een kans om een tunnelvisie te doorbreken en open te kijken naar wat er echt aan de hand is.”

www.centerdata.nl/nl/projecten-van-centerdata/pilot-datagedreven-preventief-werken