Trust models als ei van Columbus voor data governance?

“Ik heb nog nooit een organisatie gezien waar data governance volledig effectief werkt.”

Dat is een observatie van Hans Geurtsen, Managing Consultant bij Info Support. Samen met collega Mark Streutker (IT Architect) ziet hij hoe bedrijven vaak worstelen met dit complexe vraagstuk.

Het voornaamste probleem is de omvang, aldus Hans. “Data governance gaat eigenlijk over alles: waar mag je data voor gebruiken, waar komt data vandaan, wat is er onderweg mee gebeurd, wie is de eigenaar? Data governance is een soort olievlek die steeds groter wordt. Bedrijven beginnen met een klein stukje, maar het wordt al snel overweldigend.”

Context is alles

Het wordt nog complexer; de bruikbaarheid en betrouwbaarheid van data is sterk afhankelijk van het doel waarvoor je data wilt gebruiken. Hans: “Gartner gebruikte een voorbeeld om dat te illustreren. Stel, je bent verdwaald in de bergen. Google Maps doet het niet en je hebt geen internet. Dan zie je een verfrommeld kaartje op de grond liggen. Geen idee hoe oud het is, maar je herkent de bergen waar je nu loopt. In deze context is dat simpele papiertje goud waard.

“Dit voorbeeld legt perfect uit waarom bedrijven een nieuwe aanpak nodig hebben voor data governance”, vervolgt hij. “Want die kaart kan in de bergen perfect zijn voor navigatie, maar is waardeloos voor het vinden van een begraven schat. De betrouwbaarheid en bruikbaarheid van data is compleet afhankelijk van het doel en de context.”

Trust models maken het praktisch

Dit jaar introduceerde Gartner een verfrissend praktische oplossing: trust models. In plaats van te streven naar perfecte data governance overal, focus je op één kernvraag: kan ik deze data vertrouwen voor dit specifieke doel?

Het werkt met een simpel scoringssysteem. Die score bepaal je zelf op basis van kenmerken die jij belangrijk vindt. Is er documentatie? Wie is de eigenaar? Zijn er kwaliteitstests uitgevoerd? Wordt de data periodiek ververst?

Het mooie: de score staat los van de context. Een dataset met score 60 kan prima zijn voor een marketingcampagne maar ongeschikt voor de jaarrekening. Als gebruiker bepaal je zelf welke ondergrens acceptabel is voor jouw toepassing.

Van theorie naar code in één middag

Geurtsen en Streutker besloten het Gartner-concept direct in de praktijk te brengen. “We kwamen er eigenlijk achter dat het best makkelijk gaat”, aldus Hans.

Met relatief eenvoudige code lezen ze metadata uit systemen zoals Unity Catalog (Databricks) of Purview (Microsoft Fabric). Het script controleert automatisch verschillende kenmerken zoals of er documentatie is, wie de eigenaar is, wanneer de laatste update was, of er kwaliteitstests zijn gedefinieerd, of er een SLA bestaat. De lijst met criteria bepaal je zelf. Vervolgens berekent het script de trust score en plakt deze als tag op de dataset.

Het resultaat: gebruikers die zoeken naar bijvoorbeeld ‘revenue’ en tientallen resultaten krijgen, zien direct welke dataset het meest betrouwbaar is.

Stap voor stap naar betere datakwaliteit

Trust models bieden een praktische invulling van een deel van data governance. Waar complete data governance vaak te complex blijkt, biedt deze aanpak een haalbaar startpunt. Je begint klein, met de datasets die het meest gebruikt worden. Zie je dat belangrijke datasets onder de lat scoren? Dan ga je gericht aan de slag met verbeteren.

“Je kunt het in kleine stapjes, iteratief verbeteren”, benadrukt Hans. “Voor organisaties die al jaren worstelen met data governance, kan dit best een doorbraak zijn. Het is geen wondermiddel, je moet nog steeds zelf bepalen welke data relevant is voor je vraagstuk. Maar het geeft wel eindelijk grip op de betrouwbaarheid van je data.”

Direct aan de slag

Info Support heeft inmiddels een werkende oplossing in Databricks ontwikkeld. Dit concept is eenvoudig te vertalen naar bijvoorbeeld Microsoft Fabric (Purview) of een open source stack, omdat een trust model platform-onafhankelijk is.

“Je kunt hier vandaag mee beginnen”, zegt Hans. “In no-time heb je iets staan wat bruikbaar is. Dat gebeurt niet vaak bij Gartner-concepten.”

Voor managers die hun organisatie willen helpen betere beslissingen te nemen op basis van data, bieden trust models een praktisch startpunt. Het is geen vervanging voor data governance, maar een pragmatische eerste stap die direct waarde oplevert.

Trust models geven je eindelijk grip op de betrouwbaarheid van je data, zonder dat je eerst jaren moet investeren in complexe data governance trajecten.