Wat doet een Info Support Data Scientist?

Aan de hand van data en algoritmes traint een data scientist een model. Dit model kan data dat nooit eerder is gezien omzetten in bijvoorbeeld een voorspelling, gebruiken om te classificeren of te clusteren. Zoals eerder gezegd, is het ontwikkelen van zo’n model slechts een deel van het werk. Een model wordt niet eenmalig ontwikkeld, maar zal door de tijd evolueren. Daarnaast moeten modellen opnieuw getraind worden met relevante nieuwe data. Wederom is het herhaalbaar maken van deze processen het moeilijkste deel.

Niet alleen de data engineer moet nadenken over schaalbaarheid, performance, volumes, beveiliging, privacy, etc. Dit geldt ook voor de data scientist. Het is eenvoudig om in een experimentomgeving een model te ontwikkelen die exact doet wat je wil. Echter, dit model moet ook productievolumes aankunnen en daarop worden aangepast.

 

Data Scientists type B delen enige statistische achtergrond met Type A, maar ze zijn ook zeer sterke codeerders en kunnen opgeleide software-engineers zijn.

Data scientist type A vs Data Scientist type B

Om dit allemaal mogelijk te maken, moet de data scientist een flinke dosis software engineering vaardigheden bezitten. Daarom wordt voor dit type werk onderscheid gemaakt tussen een data scientist type A van Analist en een data scientist type B van Bouwer. De Data Scientist type A kan goed genoeg coderen om met data te werken, maar is niet per se een expert. De Data Scientist van type A kan een expert zijn in experimenteel ontwerp, prognoses, modellering, statistische gevolgtrekking of andere dingen die typisch worden onderwezen in statistische afdelingen en werken vaak met een statische dataset.

Data Scientists type B delen enige statistische achtergrond met Type A, maar ze zijn ook zeer sterke codeerders en kunnen opgeleide software-engineers zijn. De Data Scientist type B is vooral geïnteresseerd in het gebruik van data “in productie”. Ze bouwen modellen die interactie hebben met gebruikers. Dit type data scientist is nodig in een Machine Learning team.