Het belang van een Modern data platform

Ook zonder een grote hoeveelheid data, is het slim om al aan de slag te gaan met een modern dataplatform. Met Hans Geurtsen, Principal Data Architect bij Info Support, praten we over wat een modern dataplatform is, wat het verschil is met een traditioneel platform en waarom het een goede basis voor de toekomst is.

Podcast luisteren

Shownotes

Wat is een modern data platform

“Een modern dataplatform is een platform waarmee je allerlei soorten data: gestructureerd en ongestructureerd, big data maar ook small data, kunt opslaan vanuit allerlei bronnen. Dat kunnen traditionele systemen zijn, maar denk bijvoorbeeld ook aan moderne IoT-oplossingen(?).  Die data kun je vervolgens gebruiken voor traditionele analyses, maar je kunt het ook inzetten voor machine learning of artificial intelligence. Daar komt natuurlijk de toevoeging van het woordje ‘modern’ in modern dataplatform vandaan.”

Wat is het verschil met een traditioneel dataplatform?

“Een traditionele oplossing werkt vaak alleen met gestructureerde data. Een modern dataplatform is geschikt voor allerlei data, inclusief ongestructureerde data. Met een modern dataplatform haal je informatie uit je ongestructureerde data, zodat je daar als mens iets mee kan doen, of een systeem iets mee kan laten doen. Dat is ook een belangrijk verschil. Waar je bij een traditionele oplossing vaak ziet dat het een mens is die het platform en de data gebruikt, is het bij een modern dataplatform ook vaak andere software of een ander systeem. Artificial intelligence kan bijvoorbeeld heel goed data en informatie uit een modern dataplatform halen.”

Bouw je een modern dataplatform altijd in de cloud?

“De moderne dataplatformen die ik veel tegenkom in de praktijk, zijn allemaal cloudoplossingen. Maar het hoeft strikt genomen niet. Als je naar de fysieke implementatie kijkt, dan zie je wel vaak dat data lakes, Spark pipelines en dat soort technologieën een rol spelen. Cloudleveranciers maken het je dan een stuk makkelijker.”

Wanneer is het slim om van een modern dataplatform gebruik te maken?

Als je data omvangrijk wordt, lukt het vaak niet meer om alles in een traditionele oplossing op te slaan. Vaak lopen bedrijven tegen allerlei limieten aan zoals de opslagcapaciteit of de processing capaciteit. Het is belangrijk om de kwaliteit van je data zo hoog mogelijk te krijgen. Maar het hebben van weinig data is geen goed argument om nog niet te beginnen met het verzamelen van die data in bijvoorbeeld een modern dataplatform. Sterker nog, als je CRM nog niet op orde is, kan een AI-oplossing je juist heel erg helpen. Hiermee wordt je datakwaliteit beter inzichtelijk en toegankelijker. Met moderne technieken zoals AI kan je bovendien makkelijker herkennen waar fouten zitten en direct oplossingen vinden.”

Kan je ook klein met een modern dataplatform beginnen?

“Jazeker! Groot beginnen is bij een modern dataplatform zeker niet nodig. Het gaat veel meer om het principe, hoe je data verwerkt. Bij Info Support gebruiken we ook bij dit soort projecten een agile aanpak. Het streven is om na de eerste twee weken al businesswaarde op te leveren. We helpen je om in een week naar de cloud te gaan met een modern dataplatform. Na een week is ‘ie uiteraard niet af, maar het doel is om in een week tijd een bronsysteem aan te sluiten op een cloud platform en die data beschikbaar te stellen ten behoeve van analyse.”

Waarom twijfelen sommige bedrijven nog?

“Als we het over cloud hebben, merk je dat veel bedrijven de stap nu nog niet durven te maken. Dit geldt vooral voor bedrijven met veel data. Data is echt een bedrijfsmiddel aan het worden, en je wilt natuurlijk niet dat dat op straat ligt. Het is daarom belangrijk dat de beveiliging van je data op orde is. Veel bedrijven denken nog dat hun eigen datacenters veiliger zijn dan de cloud, maar dat durf ik te betwisten.”

Is een modern data platform over een paar jaar nog steeds een goede basis?

“Dat ligt er natuurlijk aan hoe je het platform opzet. Bij het uitkiezen van de services moet je erop letten dat je geen risico loopt op een vendor lock-in. Services zoals data lake, DataBricks en een Spark pipeline, zijn bij alle cloudleveranciers beschikbaar. Daarmee leg je een goede basis, waarvan ik niet verwacht dat ‘ie de komende jaren sterk gaat veranderen. Juist een modern dataplatform biedt je de mogelijkheid om je data in de toekomst nog breder en beter te benutten.”