Taart!

Taart! – de aanleiding

Als Business Intelligence-consultant en trainer ben ik vaak bezig met het inzichtelijk maken van data, vaak met behulp van tabellen en grafieken. Dat zorgt ervoor dat ik me regelmatig bezighoud met de vraag welke grafieken nuttig zijn voor welke doeleinden.

In dit kader kwam ik recent een leuk voorbeeld tegen in het boek Show me the numbers (Stephen Few) dat ik jullie niet wil onthouden. Het gaat over taartdiagrammen – grafieken die overal aanwezig zijn, maar bijzonder lastig zijn om correct af te lezen. Zó lastig, dat ik iemand weleens heb horen zeggen dat deze grafieken ‘eigenlijk verboden’ zouden moeten worden. Of dat daadwerkelijk zo is, laat ik hier in het midden.

Taart! – het diagram

Wat is een taartdiagram? Deze vraag zal de meeste mensen wellicht wat vreemd in de oren klinken. Iedereen weet toch wat een taartdiagram (pie chart) is? Toch, om te beginnen, een voorbeeldje van een taartdiagram (via Wikipedia):

English_dialects1997

Stephen Few vat in zijn boek kernachtig samen hoe je het taartdiagram verder zou kunnen classificeren:

“As I’m sure you know, this is a pie chart. It is part of a larger family of area graphs, which encode quantitative values as the sizes of 2-D areas. Pie charts use segments of a circle (i.e., slices of a pie). The size of each piece of the pie is equal to its value compared to the total value of all the slices.”

Wat opvalt aan het taartdiagram is dat er geen as aanwezig is. De ‘as’ waarlangs de waarden gelegd worden is impliciet: er wordt vanuit gegaan dat alles optelt tot 100%, en dat we aan de verdeling van het oppervlak zien welk percentage bij welk ’taartstuk’ behoort.

Taart! – het probleem

Maar is het ontbreken van een as nu zo’n probleem? We kunnen toch wel ongeveer inschatten hoe de verdeling is? Zoals ik in de inleiding beloofde ga ik hier niet op in in deze weblog, maar plaats ik slechts een trigger aan de hand van een voorbeeld. Bij deze:

Hieronder staat een taartdiagram, en een opdracht erbij:

Zet de taartpunten op een rij, van groot naar klein

taartdiagram

Wat was de grootste taartstuk? En wat het kleinste? Heb je een idee over welk stuk welk percentage inneemt?

Waarschijnlijk lukt het je wel om alles op de juiste volgorde te zetten, maar ben je het met me eens dat je de grafiek behoorlijk moet bestuderen om te weten te komen welk stuk nu  het grootste is. Ter vergelijk heb ik dezelfde data hieronder in een horizontaal staafdiagram weergegeven. De verschillen zijn dan opeens een stuk duidelijker, en blijken dan ook opeens een stuk groter te zijn dan taartdiagram suggereerde:

Barchart

In één oogopslag heb je hiermee een beter beeld van de verhouding van de verschillende waarden en kun je feilloos de grootste en kleinste waarde aanwijzen. Bovendien kun je met veel meer nauwkeurigheid zeggen wat de percentages zijn!

Stephen Few omschrijft de reden als volgt:

“The reason we can see the differences easily in the bar graph but with difficulty in the pie chart is that visual perception is highly tuned for seeing differences among the lengths of objects that share a common baseline but not well tuned for discerning differences among 2-D areas.”

Taart! – de conclusie

In een taartdiagram wordt het probleem van het inschatten van de grote en kleine stukken in een grafiek normaal gesproken deels ondervangen door de stukken op volgorde te zetten, van groot naar klein. Wanneer de volgorde van de stukken er verder niet toe doet maakt dit het inschatten van welke stukken groter zijn dan anderen iets makkelijker. Wat dit voorbeeld echter laat zien, is dat het menselijk oog / brein niet zo sterk is in het vergelijken van oppervlakten. Dat hoeft geen probleem te zijn: een ‘bubble chart’ gebruikt bijvoorbeeld dit juist als kracht, wanneer cijfers echt alleen maar bij hele grove benadering inzichtelijk gemaakt moeten worden. In de praktijk worden taartdiagrammen echter vaak gebruikt op plaatsen waar ze niet bepaald de beste keuze zijn. En dáár schuilt volgens mij wel een probleem.

Volgens mij ligt de oorzaak hierin: vaak maak je een grafiek zodat je data ‘in het oog springt’ – de aandacht van je lezers / gebruikers moet direct getrokken worden naar jouw grafiek. En dan werkt een felgekleurd taartdiagram tussen je tekst heel erg goed. Ik hoop je met deze post echter te triggeren om eens na te denken over de diagrammen en grafieken die je gebruikt: springen ze alleen maar in het oog, of zijn ze ook de beste manier om de informatie over te brengen?

Als je hier verder over nadenkt, dan kan ik je aanraden om Stephen Few’s boek ‘Show Me the Numbers’ te lezen (bij bol.com, amazon.com of het Computer Collectief). Of, als je echt helemaal los wilt op data-visualisatie, dan geeft Stephen Few binnenkort ook een cursus in Nederland.
 
Update: 4-6-2013 11:43
Ik kwam zojuist in een Microsoft-training de volgende quote tegen, na het uitvoeren van een opdracht waarin een taartdiagram / pie chart:
While pie charts may look interesting, be aware that they are usually not an effective data visualization. Readers of pie charts have difficulty determining the relative size of the pie slices. Furthermore, as the pie slices increase in number, so too does the difficulty in understanding the data.