Het modern dataplatform maakt razendsnel zijn opmars in het bedrijfsleven. Zo’n platform zorgt ervoor dat data binnen een organisatie makkelijker beschikbaar is voor zoveel mogelijk mensen. Zo kunnen ze op het juiste moment over de goede data beschikken. Die data moet dus kloppen. Alleen dan kan er maximaal resultaat behaald worden. Hoe weet u zeker dat het dataplatform de juiste data bevat? Testen is daar cruciaal voor.
Het testen van een modern dataplatform: een wereld waar nog veel te winnen is
Vertrouwen geven
Data is de levensader van moderne bedrijven. Zij zien een modern dataplatform als een mogelijkheid voor bijna alle medewerkers uit het bedrijf om hun werkzaamheden te verbeteren. Daar kunnen verschillende architecturen achter liggen. “Uiteraard wil je weten dat die data klopt. Testen, en inzicht geven in wat je precies test, geeft vertrouwen in de datakwaliteit aan de medewerkers die ermee aan de slag gaan”, zegt Mark Streutker, Chapter Lead Data & AI bij Info Support.
Het testen van dataplatformen verschilt flink met het aloude en bekende testen van software, zegt Streutker: “Op het oog lijkt dat min of meer hetzelfde. Maar wat je in de praktijk ziet, is dat je bij softwaretesten volledig controle hebt over alles wat je bouwt: je weet wat je erin stopt en wat je eruit haalt. Dat kun je redelijk geïsoleerd testen, wat het overzichtelijk en tot op zekere hoogte voorspelbaar maakt.”
Pipelines
Bij datatesten is dat anders. Deze tests hebben namelijk een extra component waar amper grip op is: de data zelf. Bij data uit verschillende systemen heb je geen invloed of dit goed op elkaar is afgesteld. Daarom kun je het testen van data in twee groepen verdelen: testen in de innovation pipeline en in de value pipeline.
- In de innovation pipeline probeer je de data zo geïsoleerd mogelijk te testen. De focus ligt op de aanpassing in de code. Je wijzigt software, die test je tot het functioneel klopt. Dan rol je het uit naar de productieomgeving.
- Vervolgens kom je terecht in de value pipeline. Hier ligt de focus op de data die door de oplossing stroomt. De code staat vast, je toetst de kwaliteit van de data. Je hebt het allebei nodig om over je hele platform kwaliteit te genereren.
Toch gebeurt testen in de praktijk nog niet overal op deze manier. “Testen van moderne dataplatformen is nog niet helemaal uitgekristalliseerd. Bijna iedereen doet iets met testen, maar er wordt nog weinig onderscheid in de pipelines gemaakt, of het doel van het testen is niet exact duidelijk. Dat maakt het uitdagend om het effectief in te zetten. Bovendien is testen lastig te implementeren omdat er geen kant en klare oplossing is.”
Ondanks dat nog niet iedereen uitgebreid test, is het volgens Streutker vooral belangrijk dàt er getest wordt. Of dat nou simpel is of met ingewikkelde AI, beginnen is het belangrijkste. Vervolgens kan de testcultuur worden ingebakken in het bedrijfsproces. Laat het groeien, blijf uitschieters monitoren en controleer of je eigen verwachtingen kloppen. Hoe eerder je fouten signaleert, des te sneller je actie kan ondernemen en hoe waardevoller je eindproduct wordt.