Studiedag Anchor Modeling en Data Vault

Gisteren vond op de HAN in Arnhem een studiedag over Anchor Modeling en Data Vault plaats, georganiseerd door de HAN. Eén ding werd mij deze dag wel duidelijk: als je iets met Data Vault gaat doen, is het handig iets van FCO-IM af te weten. Want dit onderwerp is vaak ter sprake gekomen. FCO-IM leent zich erg goed voor het modelleren van de Business Data Vault. De dag begon met een presentatie van Misja Nabben en Marco Engelbart die tools hebben gemaakt om applicaties te genereren vanuit metadata. De tools luisteren naar de namen IMAGine en Graphity. Graphity is simpel gezegd een generiek teken tool, IMAGine een modelgedreven applicatie interpreter. Hoewel de tools nog niet af zijn (ze zijn primair bedoeld voor educatief gebruik), is één van de dingen die je er gedeeltelijk mee kunt een FCO-IM model transformeren in een Data Vault.
Het tweede deel van de ochtend vertelde Martijn Evers ons iets over één van de stokpaardjes van Harm van der Lek: satellite links in Data Vault modellen. Harm heeft over dit onderwerp een serie artikelen geschreven in DB/M (deze artikelen zijn onder de titel “Asymmetrische Links in Data Vault” in drie delen verschenen in de eerste drie nummers van DB/M van dit jaar; de eerste twee artikelen zijn inmiddels te downloaden vanaf de DB/M website, ook voor niet DB/M abonnees, na gratis registratie). Met uitspraken als “A satellite link is not the end of the world” en “you cannot have a recipe for everything”, zette Martijn de toon. Volgens Martijn zit de raw Data Vault op een veel lager niveau dan FCO-IM, wat ervoor zorgt dat Dan Linstedt wat moeite heeft met deze satellite links, terwijl je vanuit een FCO-IM model redenerend, heel natuurlijk op satellite links uitkomt. Lars Rönnbäck (grondlegger Anchor Modeling) waarschuwde ons voor het te gemakkelijk afwijken van een standaard (als je satellite links toestaat, wijk je af van “de” Data Vault standaard, waar je maar één soort link hebt): “every decision is a risk” waarna anderen daaraan toevoegden dat het niet zo erg is wanneer je dat doet, zolang je dat maar weer duidelijk documenteert en verheft tot een nieuwe, jouw eigen standaard. Lidwine van As merkte nog op dat er in de Data Vault wereld een gebrek aan design patterns is wat dit soort discussies iedere keer weer oproept.
Na de lunch vertelde Lars Rönnbäck ons iets over timelines en de relatie tot temporal databases . Martijn Evers vulde de discussie over dit onderwerp aan met als nuttige tip dat wanneer je meer wilt weten dit onderwerp je absoluut moet beginnen met het boek Temporal data and the Relational Model van Date & Darwen. Hierna ging de discussie over in de plek van Anchor Modeling en Data Vault in de datawarehouse architectuur. Is het complementair of een vervanging van traditionele technieken? Volgens sommigen hangt dit af van de gebruikte tools. Tableau, MicroStrategy en andere tools, hebben bijvoorbeeld geen fysiek sterschema nodig en zou je op een virtuele datamart kunnen gebruiken. Anderen zijn heel stellig van mening dat je altijd fysieke dimensionaal gemodelleerde datamarts nodig hebt. Lars tipte nog een publicatie van Hugh Watson waarin verschillende datawarehouse architecturen en hun succesfactoren met elkaar worden vergeleken. Ook het onderwerp hoe we met elkaar kunnen zorgen voor een breder draagvlak van methodieken als Data Vault en Anchor Modeling kwam ter tafel. Volgens Lars is er in eerste instantie vooral behoefte aan evangelisten. Anderen noemden het gebrek aan literatuur een struikelblok. Was er maar zoiets als “The Data Vault Toolkit”…! Ook de te hoge prijzen die voor Data Vault trainingen worden gehanteerd, dragen volgens velen niet bij aan een groeiende populariteit van deze methoden.
De studiedag werd afgesloten door Maarten Ketelaars die een vergelijking trok tussen de verschillende industry models die leveranciers als IBM, Teradata, SAS en Oracle verkopen. Voorbeelden zijn bijv. het BDWM (Banking Data Warehouse Model) en IIW (Insurance Information Warehouse), beide van IBM. Maarten stelde ook ter discussie of dit soort modellen van betekenis zijn in de Data Vault wereld. De algemeen gedeelde conclusie was dat dat vooral het geval kan zijn voor de Business Data Vault, omdat industrie modellen minder over bronsystemen en meer over de business gaan.
Al met al was deze studiedag, in combinatie met het gastcollege van Lars Rönnbäck over Anchor Modeling, een leerzame ervaring. Waarvoor ik langs deze weg de HAN en de Nederlandse Data Vault gebruikersgroep nogmaals hartelijk wil bedanken!