Visualisatiefouten deren "De Morgen" niet

June 22, 2013

Op woensdag 19 juni 2013 verscheen er een artikel in De Morgen met als kop "Crisis deert superrijken niet". Eén van de twee grafieken bij het artikel verdient nadere bespreking. Ziehier de grafiek waar het over gaat:

Om de tekst iets beter leesbaar te maken voor deze blog heb ik de grafiek iets aangepast:

Let wel dat je rekening moet houden met de lengte verhoudingen in de eerste grafiek.

Het eerste dat opvalt is dat de lengte van de twee kleinste staafdiagrammen niet in verhouding staan met de blauwe getallen (de frequenties, dus). Voor de hoogste frequentie is er nog een excuus omdat daar een zogenaamde schaalonderbreking wordt weergegeven (i.e. de onderbreking halverwege de staaf met de hoogste frequentie). Zoals de grafiek er nu staat had men ook een schaalonderbreking bij de 1.068.500 moeten zetten, maar aangezien de hoogte van de eerste staaf arbitrair is ten opzichte van de voorgestelde frequentie, zouden twee schaalonderbrekingen bij een grafiek met drie staven volledig absurd zijn.

Er is echter (vermoedelijk) nog een ander probleem met deze grafiek. Immers, het lijkt zeer onwaarschijnlijk dat de labeling in deze grafiek klopt. Als we de grafiek van links naar rechts lezen (en dus van de kleinste naar de grootste frequentie) dan zijn die labels respectievelijk, "Meer dan 30 miljoen dollar", "1 tot 5 miljoen dollar" en "5 tot 30 miljoen dollar". Dit gaat in tegen de manier waarop in de Westerse wereld vermogens verdeeld zijn. Ruwweg gezegd zijn er minder mensen in de hogere inkomensgroepen. Er is geen reden waarom dat dit anders zou zijn als men binnen de rijke groep drie subgroepen zou onderscheiden (rijk, heel rijk en superrijk). Theoretisch zou het kunnen afhankelijk van de categorieën die men gebruikt, maar het zou me zeer sterk verbazen dat CapGemini en RBC Wealth Management zo contra-intuïtief zouden hebben gewerkt. Ik vermoed dus zeer sterk dat de labels van de twee hoogste frequenties in De Morgen gewoon werden omgewisseld.

Wat kan je, naast de correcte labeling, nog doen om de grafiek te verbeteren? Wel, mocht dit niet voor een krant zijn, maar voor een meer wetenschappelijke publicatie zijn, zou je allicht de frequentie voorstellen op een logaritmische schaal:

Deze grafiek geeft goed aan dat de frequentie met een factor 10 daalt wanneer je een hogere vermogenscategorie beschouwt. Maar voor een krant lijkt me een logaritmische schaal niet aangewezen. De meeste lezers bekijken zo'n grafiek slechts zeer vluchtig en heel wat lezers zijn allicht niet (meer) vertrouwd met deze voorstellingswijze. Daarom zou mijn voorkeur naar de meest eenvoudige voorstelling gaan, namelijk:

Deze voorstelling geeft nog steeds aan dat de frequentie met ongeveer een factor 10 daalt wanneer je een hogere vermogenscategorie beschouwt en maakt bovendien niet eens gebruik van een logaritmische schaal. Het nadeel is dan wel dat je laatste staaf zodanig plat is dat je er visueel weinig mee kan doen, wat, toegegeven, voor een krant wel belangrijk kan zijn;

Besluit: ik realiseer me dat ik soms zit te muggenziften als het om cijfers gaat in kranten, maar deze grafiek in De Morgen heeft geen enkele toegevoegde waarde. Meer zelfs, door de (vermoedelijke) fout in de labeling van de grafiek is de toegevoegde waarde negatief. Ik heb de indruk dat bij De Morgen grafieken, letterlijk, als bladvulling dienen, en dat de voorstellingswijze enkel bepaald wordt door de grootte en de plaats van de op te vullen ruimte, eerder dan de best mogelijke voorstellingswijze.
Ik zou De Morgen dan ook aanraden om binnen de redactie een groepje samen te stellen dat de schrijver van een artikel en de grafische dienst ondersteuning kan bieden bij de correcte voorstelling van cijfers. Het hoeven niet eens statistici te zijn. Er zijn heel wat politieke wetenschappers, sociologen, communicatiewetenschappers en psychologen die tijdens hun opleiding hier voldoende ervaring over hebben opgedaan. Ik ben er zeker van dat er binnen de redactie van De Morgen een paar jonge krachten rondlopen die deze taak met gemak op zich zouden kunnen nemen. Je zal er allicht niet meteen "The Guardian" mee worden, maar je kan er wel de meeste gênante gevallen mee vermijden.

Search This Blog

All Things Data Science

Visualisatiefouten deren "De Morgen" niet

Comments

Post a Comment

Popular posts from this blog

(small) samples versus alternative (big) data sources

Market Research and Big Data: A difficult relationship

Why The Nielsen Company is an #mrx Big Data company avant la lettre