De keuze voor de juiste database-oplossing

De term ‘big data’ heeft de afgelopen jaren veel stof doen opwaaien in it-land. Geruime tijd was het een hot topic en nog steeds raken zowel organisaties als de media er niet over uitgepraat. Toch lijkt de hype wat af te nemen en landt iedereen nu langzamerhand weer met zijn voeten op de grond. Zo wordt zelfs in de laatste Gartner Hype Cycle for Advanced Analytics and Data Science 2015 big data niet meer apart benoemd.

De meeste organisaties realiseren zich tegenwoordig dan ook dat grote hoeveelheden data, afkomstig van binnen dan wel buiten de bedrijfsmuren, hen nieuwe kansen maar zeker ook uitdagingen biedt. Dat wordt onder andere versterkt door de internet of things (IoT)-revolutie die volop gaande is. Steeds meer slimme sensoren leveren namelijk steeds meer verschillende soorten data. Deze data vragen om andere databases en andere oplossingen.

Dataopslag
De grootste uitdaging van big data zit ‘m niet zo zeer in de hoeveelheid, maar vooral in de nieuwe soorten data die van verschillende (nieuwe) bronnen afkomstig zijn. Hoe combineer je al deze soorten data zodat het uiteindelijk ook meerwaarde biedt? Een juiste database ligt hieraan ten grondslag.

De keuze voor opslag vormt dus de belangrijkste uitdaging. Anno 2015 zijn er zo veel mogelijkheden, dat het lastig is door de bomen het bos te zien. Waar je tien jaar geleden alleen nog hoefde te kiezen tussen Oracle, SQL Server of een andere relationele database, zijn daar tegenwoordig heel wat mogelijkheden bij gekomen. Zoals de vele NoSQL-varianten en Hadoop, of de in-memory mogelijkheden. En ga je voor on-premise of cloud? Er is intussen een enorm palet aan database-oplossingen met allemaal verschillende sterke en zwakke punten. Maar welke oplossing is de beste match voor jouw data?

Kenmerken data
Een belangrijke eerste stap van deze selectie is bepalen wat voor kenmerken de data heeft die je wilt opslaan. Als je bijvoorbeeld heel erg geïnteresseerd bent in het vastleggen van relaties, dan leent een graph database zich daar erg goed voor. Maar een heel financieel systeem implementeren in een graph database is weer niet zo’n goed idee.

Een volgende stap is het bepalen van de randvoorwaarden die aan het systeem worden gesteld. Wanneer je bijvoorbeeld kijkt naar de acid-aspecten van een database, zijn die voor de beschikbare database-typen verschillend (of voor sommige database-typen niet eens geïmplementeerd). Ieder type heeft zijn eigen kenmerken die voor- en nadelen kunnen hebben.

 

Lees de volledige blogpost van Info Supporter Hans Geurtsen op Computable.nl